Esta gene

Page 1

Estadística I Wa l t e r

C é s p e s d e s

R a m í r e z



FONDO EDITORIAL

Estadística I

W a lt e r C é s p e d e s R a m i r e z


FICHA TÉCNICA Título: Autor: Código: Edición: Formato: Impresión: Soporte: Interiores: Publicado:

Estadística I Walter Céspedes Ramírez CU/334-2014 Fondo Editorial de la UIGV 170 mm X 245 mm. 341 pp Offsett y encuadernación en rústica Cubierta: folcote calibre 14 Bond alisado de 75 g Lima, Perú. Abril de 2014

Universidad Inca Garcilaso de la Vega Rector: Luis Cervantes Liñán Jefe del Fondo Editorial: Fernando Hurtado Ganoza

©

Universidad Inca Garcilaso de la Vega Av. Arequipa 1841 - Lince Teléf.: 471-1919 Página web: www.uigv.edu.pe

Fondo Editorial Correo electrónico: fhurtadog@uigv.edu.pe Jr. Luis N. Sáenz 557 - Jesús María Teléf.: 461-2745 Anexo: 3712

Corrección y diagramación: Nérida Curazzi Gutiérrez

Estos textos de educación a distancia están en proceso de revisión y adecuación a los estándares internacionales de notación y referencia. Hecho el Depósito Legal en la Biblioteca Nacional del Perú Nº 2014-04906


ÍNDICE Presentación................................................................................................ 11 Introducción................................................................................................ 13 Orientaciones metodológicas.......................................................................... 15

PRIMERA UNIDAD

INTRODUCCIÓN a la ESTADÍSTICA DESCRIPTIVA.............................................. 17 Lección 1 1.1. Conceptos básicos............................................................................. 19 1.1.1. Glosario estadístico.................................................................. 19 1.1.1.1. Marco referencial...................................................... 19 1.1.1.2. Población................................................................. 19 1.1.1.3. Muestra................................................................... 20 1.1.1.4. Recopilación de datos................................................ 20 1.1.1.5. Estadígrafo.............................................................. 20 1.1.1.6. Tratamiento............................................................. 20 1.1.2. Estadística .............................................................................. 20 1.1.2.1. Estadística Descriptiva............................................... 21 1.1.2.2. Estadística Inferencial o Analítica................................ 22 Lección 2 1.2. Variables .............................................................................. 23 1.2.1. Variables Cualitativas............................................................... 24 1.2.1.1. Variables Nominales.................................................. 24 1.2.1.2. Variables Ordinales................................................... 24 1.2.2. Variables Cuantitativas............................................................. 24 1.2.2.1. Variables Discretas.................................................... 24 1.2.2.2. Variables Continuas................................................... 25

z5 z


E S TA D Í S T I C A I

Lección 3 1.3. Fuentes de Recolección...................................................................... 29 1.3.1. Clasificación de la fuente.......................................................... 29 1.3.1.1. Fuente primaria........................................................ 30 1.3.1.2. Fuente secundaria.................................................... 30 1.3.2. Métodos de recopilación........................................................... 30 1.3.2.1. Observación............................................................. 30 1.3.2.2. Encuesta................................................................. 31 1.3.3. Proceso para la recopilación de datos......................................... 31 Lección 4 1.4. Aplicaciones matemáticas................................................................... 39 1.4.1. Notación científica................................................................... 39 1.4.2. Redondeo de datos.................................................................. 42 1.4.3. Sumatoria ............................................................................. 43 1.4.3.1. Sumatoria de una variable......................................... 44 1.4.3.2. Sumatoria de una constante....................................... 45 1.4.3.3. Sumatoria de un índice.............................................. 46 1.4.3.4. Propiedades de sumatorias........................................ 48 Autoevaluación Nº 1 .............................................................................. 53 Glosario .............................................................................. 55 Exploración On Line .............................................................................. 55

SEGUNDA UNIDAD

USO DE LOS DATOS ESTADÍSTICOS................................................................ 57 Lección 1 2.1. Estadísticas para información.............................................................. 59 2.1.1. Textos .............................................................................. 60 2.1.2. Tabulados o cuadros................................................................ 60 2.1.2.1. Tabulados unidimensionales....................................... 61 2.1.2.2. Tabulados bidimensionales......................................... 62 2.1.2.3. Tabulados tridimensionales......................................... 64 2.1.3. Gráficos .............................................................................. 66 2.1.3.1. Gráficos lineales....................................................... 66 2.1.3.2. Gráficos por barras................................................... 67 2.1.3.3. Gráficos circulares.................................................... 69 2.1.3.4. Pictogramas............................................................. 70 Lección 2 2.2. Estadísticas para investigación............................................................ 71 2.2.1. Tablas de Distribución de Frecuencias......................................... 71 2.2.1.1. Distribución de Frecuencias de Variables Cualitativas..... 73 2.2.1.2. Distribución de Frecuencias de Variables Discretas........ 77 2.2.1.3. Distribución de Frecuencias de Variables Continuas....... 84 2.2.2. Gráficos .............................................................................. 89 2.2.2.1. Polígono de Frecuencias............................................. 89

z6 z


WA LT E R C É S P E D E S R A M Í R E Z

2.2.2.2. Histogramas............................................................. 91 2.2.2.3. Ojiva Menos de......................................................... 92 2.2.2.4. Ojiva Más de............................................................ 93 Autoevaluación Nº 2 .............................................................................. 94 Glosario .............................................................................. 96 Exploración On Line .............................................................................. 96

TERCERA UNIDAD

MEDIDAS DE POSICIÓN O DE LOCALIZACIÓN.................................................. 97 Lección 1 3.1. Promedios .............................................................................. 99 3.1.1. Media Aritmética .................................................................... 100 3.1.1.1. Media Aritmética Simple............................................ 100 3.1.1.2. Media Aritmética Ponderada....................................... 102 3.1.1.3. Media Aritmética para Datos Agrupados....................... 105 3.1.2. Media Geométrica ................................................................... 108 3.1.2.1. Media Geométrica Simple........................................... 108 3.1.2.2. Media Geométrica para Datos Agrupados..................... 111 3.1.3. Media Armónica ...................................................................... 115 3.1.3.1. Media Armónica Simple............................................. 116 3.1.3.2. Media Armónica para Datos Agrupados........................ 118 Lección 2 3.2. OTRAS MEDIDAS 3.2.1. Mediana 3.2.1.1. 3.2.1.2. 3.2.2. Moda 3.2.2.1. 3.2.2.2.

DE POSICIÓN CENTRAL............................................. 121 .............................................................................. 121 Mediana para Datos no Agrupados.............................. 122 Mediana para Datos Agrupados................................... 124 .............................................................................. 128 Moda para Datos no Agrupados.................................. 128 Moda para Datos Agrupados....................................... 130

Lección 3 3.3. Cuartiles .............................................................................. 137 3.3.1. Cuartiles .............................................................................. 137 3.3.1.1. Cuartiles para Datos no Agrupados.............................. 137 3.3.1.2. Cuartiles para Datos Agrupados.................................. 140 3.3.2. Deciles .............................................................................. 143 3.3.2.1. Deciles para Datos no Agrupados................................ 143 3.3.2.2. Deciles para Datos Agrupados.................................... 145 3.3.3. Percentiles ............................................................................. 149 3.3.3.1. Percentiles para Datos no Agrupados........................... 149 3.3.3.2. Percentiles para Datos Agrupados............................... 152 Lección 4 3.4. Propiedades de las medidas de posición............................................... 157 3.4.1. Cambio de origen.................................................................... 157 3.4.2. Cambio de escala.................................................................... 158 z7 z


E S TA D Í S T I C A I

Autoevaluación Nº 3 Glosario Exploración On Line

.............................................................................. 159 .............................................................................. 162 .............................................................................. 162

CUARTA UNIDAD

MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD............................................... 163 Lección 1 4.1. Dispersión con relación a una medida de posición central........................ 165 4.1.1. Desviación Media ................................................................... 165 4.1.1.1. Desviación Media para Datos no Agrupados.................. 166 4.1.1.2. Desviación Media para Datos Agrupados...................... 168 4.1.2. Desviación Mediana ................................................................. 172 4.1.2.1. Desviación Mediana para Datos no Agrupados.............. 172 4.1.2.2. Desviación Mediana para Datos Agrupados................... 175 4.1.3. Varianza .............................................................................. 179 4.1.3.1. Varianza para Datos no Agrupados.............................. 179 4.1.3.2. Varianza para Datos Agrupados.................................. 182 4.1.4. Desviación Estándar ................................................................ 185 4.1.4.1. Desviación Estándar para Datos no Agrupados.............. 186 4.1.4.2. Desviación Estándar para Datos Agrupados.................. 189 Lección 2 4.2. Dispersión entre medidas o entre datos de posición no central................. 193 4.2.1. Rango Simple ......................................................................... 193 4.2.1.1. Rango Simple de Variable Discreta................................. 194 4.2.1.2. Rango Simple de Variable Continua................................ 195 4.2.2. Variación Cuartílica .................................................................. 197 4.2.2.1. Variación Cuartílica para Datos no Agrupados................. 198 4.2.2.2. Variación Cuartílica para Datos Agrupados..................... 200 4.2.3. Variación Percentílica ............................................................... 203 4.2.3.1. Variación Percentílica para Datos no Agrupados............... 203 4.2.3.2. Variación Percentílica para Datos Agrupados.................... 205 Lección 3 4.3. Otras medidas de dispersion relativas.................................................. 209 4.3.1. Coeficiente de Variación .......................................................... 209 4.3.2. Variable Estándar ................................................................... 214 4.3.3. Coeficiente de Desviación Mediana ............................................ 215 4.3.4. Coeficiente de apertura ........................................................... 219 4.3.5. Recorrido Relativo .................................................................. 221 4.3.6. Recorrido Inter-Cuartílico Relativo ............................................. 222 4.3.7. Recorrido Semi-Inter-Cuartílico Relativo .................................... 223

Lección 4 4.4. Propiedades de las medidas de dispersión............................................ 225

z8 z


WA LT E R C É S P E D E S R A M Í R E Z

4.4.1. Cambio de origen.................................................................... 225 4.4.2. Cambio de escala.................................................................... 226 Autoevaluación Nº 4 .............................................................................. 228 Glosario .............................................................................. 231 Exploración On Line .............................................................................. 231

QUINTA UNIDAD

MEDIAS DE CONCENTRACIÓN........................................................................ 232 Lección 1 5.1. Momentos .............................................................................. 235 5.1.1. Momentos con relación al origen ............................................... 235 5.1.1.1. Momentos para datos no agrupados............................ 236 5.1.1.2. Momentos para distribuciones de frecuencias................ 238 5.1.2. Momentos con relación a la media aritmética ............................. 242 5.1.2.1. Momentos para datos no agrupados............................ 242 5.1.2.2. Momentos para distribuciones de frecuencias................ 245 Lección 2 5.2. Asimetría .............................................................................. 251 5.2.1. Tipos de Asimetría................................................................... 252 5.2.1.1. Asimetría negativa.................................................... 252 5.2.1.2. Simetría.................................................................. 252 5.2.1.3. Asimetría Positiva..................................................... 253 5.2.2. Definición de Asimetría............................................................. 253 5.2.2.1. Asimetría según Pearson............................................ 254 5.2.2.2. Asimetría según Fisher.............................................. 257 5.2.2.3. Asimetría según Bowley............................................. 262 5.2.2.4. Asimetría según Yule................................................. 265 5.2.2.5. Asimetría según Kelly................................................ 270 Lección 3 5.3. CURTOSIS .............................................................................. 271 5.3.1. Tipos de Curtosis..................................................................... 273 5.3.1.1. Platicúrtica............................................................... 273 5.3.1.2. Mesocúrtica............................................................. 273 5.3.1.3. Leptocúrtica............................................................. 274 5.3.2. Utilidad del Coeficiente de Curtosis............................................. 274 5.3.3. Definición de Curtosis............................................................... 275 5.3.3.1. Curtosis según Fisher................................................ 275 5.3.3.2. Curtosis según Cuantiles............................................ 279 5.3.3.3. Curtosis según Moors................................................ 282 Lección 4 5.4. DESIGUALDAD .............................................................................. 285 5.4.1. Formas de Concentración de Datos............................................. 285

z9 z


E S TA D Í S T I C A I

5.4.1.1. 5.4.1.2. 5.4.2. Definición 5.4.2.1. 5.4.2.2. Autoevaluación Nº 5 Glosario Exploración On Line

Concentración mínima............................................... 286 Concentración máxima.............................................. 286 de la Desigualdad...................................................... 287 Índice de Gini........................................................... 287 Curva de Lorenz....................................................... 292 .............................................................................. 295 .............................................................................. 297 .............................................................................. 297

SEXTA UNIDAD TEORÍA de las PROBABILIDADES.................................................................... 299 Lección 1 6.1. Teoría de Conjuntos........................................................................... 301 6.1.1. Operación de Unión ................................................................ 301 6.1.2. Operación de Intercepción ....................................................... 302 6.1.3. Operación de Complemento .................................................... 302 Lección 2 6.2. Teoría combinatoria........................................................................... 305 6.2.1. Factorial .............................................................................. 306 6.2.2. Permutaciones ........................................................................ 308 6.2.2.1. Permutaciones sin elementos repetidos y sin reemplazo. 308 6.2.2.2. Permutaciones sin elementos repetidos y con reemplazo. 308 6.2.2.3. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ser ubicados en línea........ 309 6.2.2.4. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ubicarlos en círculo........... 310 6.2.2.5. Permutaciones con elementos repetidos sin reemplazo tomando todos a la vez............................................. 310 6.2.2.6. Permutaciones con restricciones................................. 311 6.2.3. Combinaciones ...................................................................... 313 Lección 3 6.3. Probabilidades 6.3.1. Definición 6.3.2. Definición 6.3.2.1. 6.3.2.2. 6.3.2.3. 6.3.2.4. 6.3.2.5. 6.3.2.6. Autoevaluación Nº 6 Glosario Exploración On Line

.............................................................................. 317 numérica................................................................. 317 por Teoremas........................................................... 319 Teorema del conjunto vacío........................................ 319 Teorema del complemento......................................... 320 Teorema de la adición................................................ 321 Teorema de la multiplicación...................................... 324 Teorema de la probabilidad total o de las particiones .... 327 Teorema de la Bayes ................................................ 331 .............................................................................. 336 .............................................................................. 338 .............................................................................. 339

z1 0 z


P R E S E N TA C I Ó N

El Fondo Editorial de la Universidad Inca Garcilaso de la Vega participa como editor y productor de los textos universitarios para los alumnos de pregrado de la modalidad de educación a distancia. Esta labor exige del personal directivo, académico, profesional y técnico una visión de conjunto de las estrategias metodológicas propias de esta modalidad. El trabajo del Fondo Editorial se desarrolla en el diseño, diagramación y corrección de estilo lingüístico de los textos universitarios. Los contenidos están ubicados en los tres grandes campos del conocimiento: científico, humanístico o artístico. El esfuerzo compartido con las Facultades, a través de sus docentes-tutores, autores de los referidos libros, conduce, sin duda alguna, a la elaboración de textos de buena calidad, los cuales podrán utilizarse a través de la página web o mediante la presentación física clásica. En los últimos quince años la modalidad de educación a distancia ha evolucionado, pasando por el e-learning, que privilegia la formación profesional digital; b-learning, que combina lo tradicional y lo nuevo en el proceso de la formación profesional; hasta la aproximación actual al móvil learning, que aparece como la síntesis de todo lo anterior y una proyección al futuro. Con todo ello, el Fondo Editorial reitera su compromiso de participar en la tarea universitaria de formación académica y profesional, acorde con los tiempos actuales.

Fondo Editorial z1 1 z



INTRODUCCIÓN

El objetivo principal de este libro, es el de brindar a todos los estudiantes los conocimientos necesarios para comprender el uso de la Estadística Descriptiva o Estadística I, de tal manera que pueda resolver casos con rapidez y precisión mediante el uso de estadígrafos. El texto empieza dando una serie de conceptos utilizados en Estadística, para que el alumno pueda entender nuevos términos o nuevos significados que son propios de esta asignatura, focaliza las fuentes de información y diferencia las dos principales variables de información, tanto la variable no numérica o cualitativa de la numérica o cuantitativa; adicionalmente, en este inicio se incluyen algunas operaciones aritméticas como las notaciones científicas y el redondeo de datos que son de gran utilidad en la reducción de cifras, además de las sumatorias empleadas en la mayoría de las fórmulas estadísticas. En la estadística descriptiva existen dos modalidades de trabajo, que los textos no precisan, que bien podrían verse por separado para no confundir al lector; resulta que después de recopilar la información necesaria, esta puede tener dos destinos que son: estadísticas para informar o publicar, que tienen una forma de presentación para que las comprenda cualquier lector, y estadística para investigar, que se presenta ordenada especialmente para recibir un tratamiento con medidas estadísticas, de tal manera que la investigación continúa. Al mencionar un tratamiento con medidas estadísticas, en este texto se analizarán: las medidas de posición o de localización, las medidas de dispersión o de variabilidad y las medias de concentraz1 3 z


E S TA D Í S T I C A I

ción. Cada uno de estos tipos de mediadas tienen la particularidad de dar a conocer las características de los datos u observaciones con relación a la ubicación del dato principal o central, la variabilidad entre ellos con relación a un valor central, la forma cómo se distribuyen y la manera en que se concentran. Finalmente, después de hacer todo el trabajo descriptivo con las mediadas mencionadas, se ingresa al mundo de las probabilidades que para el investigador estadístico tienen gran importancia, porque con ellas se abren las puertas para ingresar a la estadística inferencial, que es motivo de la asignatura Estadística II. Al término del estudio de este manual autoinstructivo, el alumno debe entender que los conocimientos que ha adquirido no es la culminación de todos los elementos estadísticos y que ya está en condiciones de tomar decisiones de índole empresarial en cualquier nivel de la misma, sino que ha empezado a entender la actividad empresarial en términos cuantitativos.

El autor

z1 4 z


orientaciones METODOLÓGICAS

El manual autoinstructivo está compuesto por 6 unidades temáticas.

Estructura del Manual Se está incluyendo en el MAI de Estadística Descriptiva todas las unidades temáticas del sílabo que esta facultad ha considerado necesarias en todas las modalidades de estudio, incluyendo la modalidad a distancia; tales unidades temáticas son: Primera Unidad :

Introducción a la estadística descriptiva

Segunda Unidad :

Uso de los datos estadísticos

Tercera Unidad :

Medidas de posición o de localización

Cuarta Unidad :

Medidas de dispersión o de variabilidad

Quinta Unidad :

Medias de concentración

Sexta Unidad

Teoría de las probabilidades

:

Instrucciones para el alumno 1° Para facilitar el entendimiento de esta asignatura, se recomienda tener claro lo aprendido en las asignaturas de Matemáticas. 2° Debe tener siempre a la mano: cuaderno, lápiz o lapicero, borrador y una calculadora que tenga más funciones de aquellas que solo manejan las 4 operaciones aritméticas. z1 5 z


E S TA D Í S T I C A I

3° Leer con detenimiento cada ítem de una unidad temática y una vez entendido lo que se dice allí, resolver los ejercicios propuestos, por cada ítems. 4° Culminada la unidad resolver la prueba autoevaluativa que está al final, luego comparar las respuestas obtenidas con las claves de respuestas que se dan. 5° Si ha respondido correctamente al menos 9 de los 15 ejercicios, usted esta en condiciones de seguir con la siguiente unidad, en caso contrario, se recomienda hacer un repaso.

Nota importante Si por alguna razón no logra entender con facilidad cualquier tema de los mencionados, se recomienda solicitar asesoría que le sirva de orientación en el aprendizaje del curso.

Mucha suerte y felicitaciones por cada unidad aprendida

z1 6 z


p r i m e r a

UNIDAD Introducción a la Estadística Descriptiva

Conceptos básicos: Glosario estadístico, Estadística Variables: Cualitativas, Cuantitativas Fuentes de recolección: Clasificación de la fuente, Métodos de recopilación, Prosceso para la recolección de datos Aplicaciones matemáticas: Notación científica, Redondeo de datos, Sumatorias


OBJETIVO (S) GENERAL Aprender que la estadística descriptiva es parte de todo un proceso de investigación que le permite al estudiante conocer la composición de los datos que se estudian. Por ello, se propone en esta unidad, los términos y significados más importantes utilizados por los investigadores, para que entienda sus técnicas y herramientas de mayor utilidad. También, es necesario conocer las variables que engloban datos, porque se le dará el tratamiento respectivo dependiendo del tipo de esta. Otra necesidad del investigador es la de conocer la procedencia o fuente de información, ya que la credibilidad de los resultados, va a depender de ella; finalmente, como la Estadística utiliza en muchas ocasiones datos numéricos, aquí se recuerda al estudiante las aplicaciones matemáticas que utiliza. ESPECÍFICOS • Conocer los términos que se utilizan en la Estadística, así como la división o campo de acción de esta ciencia. • Saber porqué tienen tratamientos diferentes tanto las variables cualitativas como las cuantitativas. • Determinar la responsabilidad de las fuentes de información, que son las que proporcionan las observaciones para conocer sus métodos y procesos. • Recordar que algunas aplicaciones matemáticas son de mucha utilidad en el tratamiento de los datos, que permiten simplificar las cifras numéricas, facilitando su uso.


L e c c i ó n

1

1.1 CONCEPTOS BÁSICOS Se recopilan en esta lección todos aquellos conceptos que el lector debe conocer para entender esta asignatura. En términos generales se reúnen aquí conceptos relacionados con la estadística y su división, con los datos u observaciones, además de sus características y limitaciones.

1.1.1. Glosario estadístico Son los términos propios de la Estadística, por lo que es necesario que todo estudiante de esta disciplina los conozca, para que pueda utilizarlos apropiadamente, además de entender con claridad la estadística descriptiva.

1.1.1.1. Marco referencial Es el alcance de la variable o variables que constituyen problemas que se investigan. Para un investigador es importante saber hasta dónde debe llegar, por ello todo marco referencial es el límite de la investigación. Así por ejemplo, si se investigan problemas relacionados con las universidades, el marco referencial nos dirá si se investiga: una universidad en particular, todas las universidades de Lima, todas las universidades del Perú, etc.

1.1.1.2. Población Es el universo de los datos o unidades de información que se investiga; en cuanto a su alcance, es toda la información que existe respecto a una variable limitada por el marco referencial. En cuanto a su contenido; las poblaciones pueden ser limitadas, cuando se pueden contar todos los datos u observaciones, por ejemplo las matriculas z1 9 z


E S TA D Í S T I C A I

del actual semestre académico; también pueden ser ilimitadas, cuando no se pueden contar todos los datos u observaciones, por ejemplo la producción agrícola de maíz en el Perú o la cantidad de vino que produce Europa para el mundo, debido a que se siguen produciendo.

1.1.1.3. Muestra Es parte de una población, mayormente los investigadores prefieren trabajar con muestras, porque utilizan pocos datos ahorrando tiempo y costos principalmente. La muestra es la porción de la población que se selecciona para su análisis, se caracteriza por tener un tamaño conocido, es decir que tiene límites y permite estudiar poblaciones incluyendo las ilimitadas.

1.1.1.4. Recopilación de datos Cuando se recogen las observaciones o datos, estos pueden hacerse en forma total o en forma parcial. El proceso de recolección total se llama censo, a través del cual se obtiene la población. El proceso de recolección parcial se llama muestreo, a través del cual se obtiene una muestra que es representativa de la población. El censo solo es posible con poblaciones limitadas; es decir, con poblaciones que pueden contarse todos sus elementos; en cambio, no es posible hacer un censo en poblaciones de naturaleza ilimitada. El hecho de que no se pueda realizar un censo en poblaciones ilimitadas, no es razón suficiente para dejar de hacer un estudio las observaciones que aún se encuentran en proceso de producción, ya que existe el muestreo.

1.1.1.5. Estadígrafo Es un indicador que se obtiene al procesar cualquier medida estadística de resumen, tanto de posición o localización, como de dispersión o variabilidad. Cuando este indicador se obtiene de una muestra toma el nombre de estimador, y cuando su procedencia es de una población toma el nombre de parámetro.

1.1.1.6. Tratamiento Se refiere al procesamiento de los datos (unidad de información), con el objeto de obtener una medida descriptiva que generalmente es un estimador, para luego hacer una inferencia, que es otro tratamiento pero esta vez del estimador para convertirlo en parámetro.

1.1.2. Estadística Etimológicamente el término estadística viene del alemán statistik, que fue primeramente introducido por Gottfried Achenwall (1749), quién designaba originalmente el análisis de datos del Estado, como la “ciencia del Estado” (también llamada aritmética política de su traducción directa del inglés). No fue hasta el siglo XIX cuando el término

z2 0 z


WA LT E R C É S P E D E S R A M Í R E Z

“estadística” adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el inglés John Sinclair. En su origen, por tanto, la Estadística estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadísticas nacionales e internacionales. En particular, los censos suministran información regular acerca de la población. Hacia el año 3 000 a. C. los babilonios usaban ya pequeños envases moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros vendidos o cambiados. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI a. C. Los libros bíblicos de Números y Crónicas incluyen en algunas partes trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a. C. Los antiguos griegos realizaban censos cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos. Cada vez que alguien habla de cifras, inmediatamente se asocia tales cifras con las estadísticas; de tal forma que por ejemplo al referirse al número de accidentes de tránsito, la pregunta es ¿cuáles son las estadísticas de accidentes de tránsito? Resulta que Estadística es eso y mucho más, porque es una ciencia que además de proporcionarnos datos, nos da una serie de procedimientos, metodologías y otras herramientas de mucha utilidad para presentar ordenadamente la información recibida en cuadros y gráficos, también partiendo de una muestra, nos permite obtener conclusiones valederas del comportamiento de la información, a nivel población. Además con el análisis e interpretación de datos puede ayudar en la resolución de la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado. Por lo general la Estadística se divide en dos partes: una denominada estadística descriptiva, basadas en observaciones o en datos, y la otra denominada Estadística Inferencial, basada en el razonamiento sobre las observaciones.

1.1.2.1. Estadística Descriptiva Es la parte de la Estadística que está basada en las observaciones o datos, por lo tanto se ocupa de la recolección y análisis del correspondiente de una muestra o de una población, para obtener conclusiones de los mismos. Esta parte solo se preocupa de: ordenar, tabular, graficar y calcular estadígrafos de los datos que se investigan; por ello se denomina estadística descriptiva, porque su acción solo se limita a describirlos. Estadística descriptiva, puede definirse como aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto.

z2 1 z


E S TA D Í S T I C A I

1.2.2.2. Estadística Inferencial o Analítica Es la parte de la Estadística que está basada en el razonamiento sobre las observaciones y se ocupa del estudio de la población a partir de una muestra. Estadística inferencial, puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población basándose solo en los resultados de una muestra. Uno de los problemas fundamentales de la Estadística, es el estudio de la relación existente entre una población y sus muestras. Según la dirección que tome tal relación, la Estadística puede ser: Deductiva, cuando a partir del conocimiento de la población se trata de caracterizar cada muestra posible. Inductiva, cuando a partir del conocimiento derivado de una muestra se pretende caracterizar la población.

z2 2 z


L e c c i ó n

2

1.2. Variables Se denomina variable a una característica o cualidad básica de la información que se investiga, que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores numéricos o modalidades cualitativas; es decir, es toda característica que varía de un elemento a otro en una población. La variable es un símbolo, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante. Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son los valores de la variable. Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número, son aquellas características que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de modalidades. A pesar de que existen diferentes maneras de clasificar una variable, en este texto solo se tratará de la clasificación según su intensidad, por ser la más importante para la Estadística, que son: el valor que toma y la modalidad que la variable adquiere.

z2 3 z


E S TA D Í S T I C A I

1.2.1. Variables Cualitativas Son aquellas variables denominadas también de atributo, porque no adquieren valores numéricos. Estas variables se caracterizan por que adquieren distintas modalidades, ya que pueden ser nombradas o descritas, también pueden ser el resultado de una comparación. Estas variables no pueden ser medidas numéricamente, pero si pueden ser medidas según su categoría, las cuales se subdividen en:

1.2.1.1. Variables Nominales Son aquellas variables no numéricas que se caracterizan por nombrar, describir o comparar una modalidad. Ejemplo: la relación de estudiantes de un aula, la relación de países pobres de América, etc. En el primer ejemplo se hace referencia a nombres y el segundo se hace referencia a una descripción.

1.2.1.2. Variables Ordinales Son aquellas variables no numéricas que se caracterizan por ser el resultado de una comparación. Ejemplo: la selección de estudiantes de un aula para un evento internacional, la relación de países más pobres de América, etc. Ambos ejemplos son por el resultado de comparar los atributos de la variable, porque usted no puede seleccionar sin comparar, tampoco puede saber sin son más o menos pobres sin comparación.

1.2.2. Variables Cuantitativas Son aquellas variables denominadas también cuantificadas, porque tienen valores numéricos. Estas variables se caracterizan porque adquieren distintos valores dentro de su recorrido, dentro de los cuales puede haber solamente números enteros o también números combinados entre enteros y decimales. Estas variables que pueden ser medidas numéricamente se subdividen en:

1.2.2.1. Variables Discretas Son aquellas variables numéricas que dentro de su recorrido, solo puede aceptar valores enteros, estas variables por su naturaleza no pueden aceptar fraccionamiento de un valor numérico, porque se obtienen únicamente por conteo; es decir, que una forma de cuantificar una variable es contando las veces que aparece al relacionarla con otra de sus características. Por ejemplo se tiene la variable ASISTENCIA (característica básica) que va a ser asociada a los DÍAS (característica complementaria), resulta la asistencia del lunes, la asistencia del martes, etc., cada una de estas asistencias representan solamente un valor numérico entero.

z2 4 z


WA LT E R C É S P E D E S R A M Í R E Z

1.2.2.2. Variables Continuas Son aquellas variables numéricas que dentro de su recorrido, puede aceptar valores reales (enteros y/o decimales), estas variables por su naturaleza si pueden aceptar fraccionamiento de un valor numérico, porque se obtienen como resultado de una medición; es decir, que la forma de cuantificar una variable es midiendo el valor que adquiere al relacionarla con otra de sus características. Por ejemplo, se tiene la variable EDAD (característica básica) que va a ser asociada con PERSONAS (característica complementaria), resulta la edad de Enrique, la edad de María Paula, etc., cada una de estas edades representan un valor numérico entero y/o decimal.

En los siguientes ejercicios que se dan a continuación respecto a la subdivisión de una variable según su intensidad, es posible que haya más de una respuesta en cada ejemplo. En los casos de que usted encuentre una respuesta cualitativa y otra cuantitativa, la respuesta cualitativa prevalece sobre la cuantitativa ya que todas las variables pueden ser cuantificadas.

Ejercicios sobre variables Considerando la subdivisión de una variable según intensidad, determine a qué subdivisión se refieren los siguientes ejemplos: 1) Las evaluaciones de un grupo de estudiantes.

Respuesta: (

)

2) La cantidad de monedas emitidas por el BCR del Perú.

Respuesta: (

)

3) La obras escritas por César Vallejo

Respuesta: (

)

4) Las clases magistrales de un profesor.

Respuesta: (

)

5) Las mejores clases magistrales de profesor.

Respuesta: (

)

6) Las clases de un profesor de una universidad.

Respuesta: (

)

7) Las remuneraciones de los empleados de la categoría “A”.

Respuesta: (

)

8) Las auditorías realizadas por la Contraloría.

Respuesta: (

)

9) Los convenios firmados entre naciones con el Perú.

Respuesta: (

)

10) La relación de asistentes a una conferencia.

Respuesta: (

)

11) La calidad del espejo de una vitrina.

Respuesta: (

)

12) El carácter de una persona.

Respuesta: (

)

13) Las monedas de mayor circulación en el Perú.

Respuesta: (

)

z2 5 z


E S TA D Í S T I C A I

14) El hijo mayor de una familia.

Respuesta: (

)

15) La lista de personas heridas en un atentado.

Respuesta: (

)

16) El número de inscritos en una competencia deportiva.

Respuesta: (

)

17) La edad de Pedro.

Respuesta: (

)

18) La selección de fútbol de Perú.

Respuesta: (

)

19) Los sueldos de los magistrados.

Respuesta: (

)

20) La capacidad de un estanque.

Respuesta: (

)

21) La capacidad de un auditorio.

Respuesta: (

)

Respuestas al ejercicio: 1)

Variable continua, porque evaluación se refiere a una unidad de medida.

2)

Variable discreta, porque se refiere al número de monedas emitidas.

3)

Variable discreta, porque se refiere al número de obras.

4)

Variable nominal, porque el término magistral se refiere a una descripción de las clases del profesor.

5)

Variable ordinal, porque es una comparación entre las clases magistrales del profesor, en este caso el término magistral (nominal) deja de tener importancia como clasificación de la variables y menos aún cuantas son (discreta).

6)

Variable discreta, porque se refiere al número de clase del profesor universitario, la descripción del profesor deja de tener importancia.

7)

Variable continua, porque se refiere al salario del trabajador de categoría “A”, la descripción de la categoría de empleado deja de tener importancia, porque la referencia es a las remuneraciones que se encuentran dentro de una escala según el puesto.

8)

Variable discreta, porque se refiere al número de auditorías.

9)

Variable discreta, porque se refiere al número de convenios firmados.

10) Variable nominal, porque una relación es una lista de nombres. 11) Variable nominal, porque es una descripción sobre el espejo 12) Variable nominal, porque es una característica de una persona 13) Variable ordinal, porque el término mayor circulación solo resulta de una comparación. 14) Variable ordinal, porque el término mayor solo resulta de una comparación. 15) Variable nominal, porque es una lista de nombres. 16) Variable discreta, porque se refiere a la cantidad de inscritos en una competencia. 17) Variable continua, porque se refiere a la edad que solo se mide con relación al tiempo. z2 6 z


WA LT E R C É S P E D E S R A M Í R E Z

18) Variable ordinal, porque una selección solo resulta de una comparación. 19) Variable continua, porque se refiere a los sueldos que se encuentran dentro de una escala según el puesto de magistrado. 20) Variable continua, porque capacidad se refiere a una unidad de medida de igual nombre. 21) Variable discreta, porque se refiere al aforo (cantidad de personas) de un auditorio.

z2 7 z



L e c c i ó n

3

1.3. FUENTES DE RECOLECCIÓN Son llamadas también fuentes de información, porque permiten al investigador obtener datos u observaciones para utilizarlos con fines estadísticos. Para muchos, una fuente de información es una organización o institución pública o privada que provee de datos a quien lo solicite. Para otros, una fuente de información es una revista, un periódico, un libro o cualquier tipo de publicación que provee de datos a quién la requiera. También se considera como fuente de información a archivos, registros y documentos; impresos o virtuales que provee de datos a quienes tengan acceso a ellos. Como usted puede ver, una fuente de datos no es solo una institución, es también una publicación o simplemente un registro que se encuentra disponible de manera restringida. Por otro lado, algunas veces se recurre a información ya elaborada, porque cubre las necesidades del investigador, otras veces es necesario preparar una serie de preguntas que sirvan para cubrir nuestras necesidades de información. Por lo expuesto, de deduce que existen dos tipos de fuentes de información, aquella que nos provee datos existentes y aquellas que nos provee datos por la necesidad de recolección de información propia.

1.3.1. Clasificación de la fuente El concepto de fuentes de información ha evolucionado, ahora se identifican por la manera cómo se recolectan los datos, que son de manera directa con información propia actual o fuente primaria, y de manera indirecta con información pasada elaborada no necesariamente con fines estadísticos o fuente secundaria. z2 9 z


E S TA D Í S T I C A I

1.3.1.1. Fuente primaria Algunos piensan que las fuentes primarias son más confiables, porque son efectuadas por oficinas especializadas encargadas de ese fin. Lo que ocurre es que este tipo de fuente por conseguir información directa de informantes previamente seleccionados, utiliza preguntas ordenadas en una encuesta, para facilitar al investigador de toda la información que necesite; pero la confiabilidad de la información está en la responsabilidad en que se realice el trabajo. Toda fuente primaria, conformada generalmente por una encuesta, es fuente directa de información, porque genera información exclusiva acorde con las necesidades del investigador, con la encuesta se puede contar con información propia, elaborada con el único fin de conseguir datos actuales de gran utilidad para alcanzar las metas propuestas.

1.3.1.2. Fuente secundaria La información pasada ya existente y disponible en una institución, una publicación o en un archivo; constituyen una fuente secundaria de información. La confiabilidad de este tipo de fuente, va a depender solo de la seriedad con que fue elaborada y no del tipo de fuente. Los archivos que sirven para proveer datos al investigador, la estadística les llama registro administrativo, ya que no fueron hechos con fines estadísticos, pero pueden servir para tal fin, por ello a esta fuente se le denomina fuente indirecta. Además de los archivos, existen otras fuentes secundarias de información, como los informes de organizaciones, publicaciones, documentos de carácter privados, encuestas pasadas, etc.

1.3.2. Métodos de recopilación Conocida la fuente de información, existen dos maneras prácticas de obtener los datos que el investigador necesita para desarrollar su actividad, estos métodos son: la observación y la encuesta.

1.3.2.1. Observación Consiste en poner los sentidos sobre lo que se quiere conocer, de tal manera que un escrito o figura se observa con la vista, un sonido se observa con el oído, un aroma se observa con el olfato, un objeto puede ser observado con el tacto y finalmente el sabor es observado con el sentido del gusto. En otras palabras, observar es poner los sentidos sobre lo que se investiga, para tomar nota de lo que se considera importante. La observación es la forma de investigar una fuente secundaria que es de naturaleza personal, que se encuentra al servicio de una organización. z3 0 z


WA LT E R C É S P E D E S R A M Í R E Z

1.3.2.2. Encuesta Con el objeto de obtener datos actualizados directamente de personas sobre la o las variables en estudio, se utiliza la encuesta, que es un conjunto de preguntas elaboradas especialmente para la investigación. Como se sabe, la encuesta es un instrumento para conseguir datos actuales de lo que se investiga, pero para ejecutarla y conseguir la información, existen dos métodos que son: el cuestionario y la entrevista. El cuestionario, es un método de conseguir información con encuestas, en el que participa una persona (informante), quien se encargará de resolver todas las interrogantes, para hacerlas llegar al solicitante de la información a través de algún medio. El informante contesta las preguntas y la consigna en el formato encuesta, por consiguiente todo cuestionario va de persona a documento. La entrevista, es otro método de conseguir información con encuestas, en el que participan dos personas: el informante quién se encargará de resolver todas las interrogantes, y el entrevistador quien formula e interpreta si es preciso las preguntas, para anotar las respuestas en la propia encuesta. El informante contesta las preguntas y el entrevistador las recibe para luego consignarlas en el formato encuesta, por consiguiente toda encuesta va de persona a persona.

1.3.3. Proceso para la recopilación de datos Recopilar datos de una fuente secundaria, solo requiere determinar qué información rescatar y de dónde obtenerla; mientras que sacar información de una fuente primaria, requiere de una serie de pasos, que a continuación se describen: 1º Definir el problema. Cuando una organización desea cambiar, mejorar o alcanzar algo de interés, para ella se convierte en una necesidad que se define como un problema de decisión gerencial, en donde se determinará qué deberá hacerse para resolverlo. Cuando el problema involucra la opinión de usuarios o consumidores, entonces la gerencia determina que se trata de un problema de investigación de mercado, y para resolverlo, debe contratar los servicios de una empresa especializada en investigación de mercados, si no cuenta con ese servicio. 2º Determinar el objetivo general. La empresa investigadora, luego de conversar con el gerente y demás involucrados en el caso, determina ¿cuál? es el objetivo general de la investigación. 3º Definir los objetivos específicos. definido el objetivo general, este se subdivide en varias partes, que representan los objetivos específicos, los cuales son más precisos.

z3 1 z


E S TA D Í S T I C A I

4º Elaborar el plan de investigación. Establecidos los objetivos específicos, a cada uno de ellos, se le asigna una pregunta de investigación, que como resultado de ella aparecen las variables a investigar. Posteriormente conocidas las variables, se fija la fuente de investigación y se formula la hipótesis correspondiente; es decir, ¿qué? se espera encontrar al concluir la investigación. 5º Elaborar las preguntas de la encuesta. Identificadas cuáles son las variables a investigar, se procede a elaborar cada una de las preguntas que se relacionan con ellas, incluyendo solo las variables de fuente primaria, porque las variables de fuente secundaria, se van a conseguir con otro proceso. Las preguntas en la encuesta deben ser ordenadas de acuerdo con una secuencia lógica y no necesariamente deben tener el orden de presentación de los objetivos específicos. En la formulación de las preguntas, se deben utilizar palabras comunes fáciles de entender y todas deben hacerse cerradas en lo posible. Una encuesta generalmente utiliza diferentes tipos de preguntas, dependiendo de los objetivos que se propone alcanzar, entre las más usadas están: - Nominal dicotómicas cerradas: Son aquellas que solo responden a: “sí” o “no”. - Nominal cerradas: Son la mayoría de las preguntas en toda encuesta, en donde se tiene que escoger una respuesta entre varias. - Nominal de respuesta múltiple: Son las preguntas que tienen varias respuestas a la vez, pero están ordenadas de acuerdo con la opinión del encuestado. - Escalar unipolar: Se utilizan generalmente en edades y en ingresos, porque estos asuntos son considerados por los encuestados como personales, a los que no desean precisar con exactitud. En estos casos las respuestas se encuentran dentro de un rango. - Escalar con intensión de asistencia: Son preguntas que orientan al encuestado, se utilizan cuando se desea conocer la frecuencia o la intensidad del uso o consumo. - Diferencial semántico: Son preguntas de opinión utilizadas principalmente para evaluación, en donde de precisan los extremos y dentro de ellos se pone una escala de números correlativos a partir de 1, para que el encuestado califique que tan cerca o que tan lejos está su opinión dentro de dichos extremos. - Tipo Likert: Son preguntas que se formulan en forma positiva o en forma negativa, para conocer la opinión del encuestado, para que responda a una de las 5 opciones siguientes: concuerda fuertemente (CF), concuerda (C), no opina (NO), discrepa (D) y finalmente discrepa fuertemente (DF). - Tipo Thurstone: También son preguntas de opinión, que se utilizan para comparar: entidades, productos o servicios; entre los nuestros con productos o servicios de los competidores, el encuestado debe elegir entre las dos opciones, cuál prefiere. z3 2 z


WA LT E R C É S P E D E S R A M Í R E Z

6º Puesta en prueba la encuesta. Después de saludar a la persona que se desea encuestar y se mencione el objeto de la encuesta, cabe la pregunta ¿podría usted participar? Si la respuesta es afirmativa, se procede a probar las preguntas de la encuesta, para saber si están claras todas ellas, esta prueba se realiza con muy pocas personas. 7º Ejecutar la encuesta. En esta parte se repite lo mencionado en el paso anterior, con la diferencia de que la participación es masiva con la cantidad de personas que fue establecida en el estudio del caso, concluida la encuesta se agradece la participación del encuestado. 8º Tabular los resultados. Se hace un resumen numérico de las respuestas obtenidas en cada variable, con el objeto de conocer la apreciación de los participantes a las interrogantes que servirán de base para confirmar o no las hipótesis planteadas. 9º Obtener las conclusiones. Son resúmenes de los resultados de la encuesta, los que generalmente se presentan acompañados de gráficos, de cuadros de datos más representativos y de algunas medidas estadísticas de importancia. 10º Realizar las recomendaciones necesarias. Son las observaciones encontradas en la investigación, para que la empresa tome las medidas correctivas necesarias, de tal manera que se resuelva el problema planteado.

Ejercicio sobre la elaboración de una encuesta: Para elaborar una encuesta, primero se debe contar con un proyecto sobre el cual se precise esta necesidad. En la elaboración de toda encuesta se deben dar los 5 primeros pasos del proceso de recopilación de datos. A continuación se verá el siguiente caso: Proyecto para alcanzar la excelencia en la calidad del servicio de la Agencia 7 del BanMachu Picchu del distrito de San Sebastián del Cusco, frente a sus competidores.

co

1. Definir el problema: El Banco Machu Picchu es un banco joven que desea tener mayor cobertura en el Perú, pero un estudio a nivel nacional, está por el momento fuera de su presupuesto, generándose un problema de decisión gerencial; por ello, decide realizar un plan de investigación pequeño en una de sus agencias del Cusco. El gerente tiene la seguridad de que con los resultados de la investigación, le dará una idea sobre la estrategia a utilizar a nivel nacional. La empresa de investigación contratada quiere conocer, cuáles son las fortalezas y cuáles son las debilidades de la Agencia 7 de San Sebastián del Cusco, frente a sus competidores, tomando en cuenta los factores que determinan la calidad de un servicio para obtener la calificación de excelente, generándose un problema de investigación de mercado que hay que resolver mediante una encuesta dirigida solamente a las personas que salen de la Agencia 7, después de haber sido atendidas.

z3 3 z


E S TA D Í S T I C A I

2. Objetivo general: Identificar las fortalezas y las debilidades de la Agencia 7 de San Sebastián del Cusco, frente a sus competidores. 3. Objetivos específicos: Con relación al objetivo general, se desprenden los siguientes objetivos específicos: a) Conocer el criterio que utilizan los clientes para elegir un buen banco. b) Conocer como evalúan los clientes del Banco Machu Picchu de la Agencia 7 y a los competidores, respecto al criterio de selección de un buen banco. c) Analizar los servicios de mayor preferencia por los clientes, en qué banco o bancos. d) Conocer la participación en el mercado de Banco Machu Picchu con relación a los servicios que ofrece la Agencia 7. e) Conocer el perfil demográfico y psicográfico de los clientes de la Agencia 7 del Banco Machu Picchu y establecer diferencias con la de los competidores. f) Conocer la frecuencia de las visitas, el tiempo de demora en la atención al público y los niveles de satisfacción. 4. Plan de investigación: Todo plan de trabajo, debe relacionar cada objetivo específico con: preguntas de investigación, las variables, las hipótesis y las fuentes:

Objetivos específicos Cómo elegir un buen banco.

Preguntas de investigación

Variables

¿Qué característica Limpieza, atención, busca usted en un buen banco? rapidez, apariencia

Cómo evalúa ¿Cómo evalúa al perclientes a la sonal, seguridad y amAgencia 7 biente de la agencia?

Hipótesis

Tiene la Agencia 7 una Primaria excelente calidad en el servicio

Actitud, seguridad, Los servicios de la Agen- Primaria ambiente, presencia cia 7 son mejores que la de sus competidores.

Analizar los ¿Qué operaciones Tipo de servicios servicios de realizas en la agencia mayor pref. 7?

En la Agencia 7 el servicio de mayor preferencia es la cuenta corriente

Participación

Primaria

Secund.

Perfil demog. ¿Cuáles son las Ubicación, edad, de clientes de c a r a c t e r í s t i c a s sexo,niveles de inla Agenc. demográficas de los greso clientes? F r e c u e n c i a s ¿Con qué frecuencia de visitas. asiste? ¿Qué tiempo espera?

Fuentes

No hay diferencia en el perfil demográfico entre clientes de la agencia y competidores.

Primaria

Frecuencia de uso Existe satisfacción endemora. tre los cliente de la Agencia

Primaria

z3 4 z


WA LT E R C É S P E D E S R A M Í R E Z

El cuarto objetivo específico, por utilizar fuente secundaria, solo se menciona en el plan, porque tiene otro proceso de investigación. 5.Elaboración de la encuesta: Tomando como base el plan de investigación, se procede a elaborar una pregunta por cada variable, de la siguiente manera: Buenos días (buenas tardes), estamos realizando una encuesta para conocer cómo el cliente percibe la calidad del servicio de esta agencia, ¿podría participar?

ENCUESTA 1) ¿Es usted cliente o usuario de esta agencia bancaria? 1 – Cliente 2 – Usuario 2) ¿Qué características busca usted en un buen banco? 1 2 3 1 – Limpieza 2 – Orden 3 – Buena infraestructura 4 – Atención amable 5 – Servicio rápido 3) ¿Con qué frecuencia asiste a esta agencia bancaria? 1 – Diariamente 3 – Mensualmente 2 – Semanalmente 4 – Cuando lo necesito 4) En esta agencia usted fue atendido: 1 – Por un ejecutivo 2 – En ventanilla 3 – En plataforma 5) ¿Qué operación u operaciones realizó usted en la agencia? 1 2 3 1 – Cuenta corriente 2 – Ahorros 3 – Préstamos 4 – Servicios varios 6) ¿Entre qué intervalos de tiempo estuvo en cola de espera? 1 – Menos de 10 minutos 3 – Entre 20 y 30 minutos 2 – Entre 10 y 20 minutos 4 – Más de 30 minutos 7) ¿Cómo evaluaría usted a la persona que le atendió? 1 2 3 4 5 1 – Atención amable 2 – Buena apariencia 3 – Atención al saludo 4 – Despedida atenta 5 – Servicio rápido z3 5 z

No amable Sin apariencia No saluda Sin Despedida Sin rapidez

-


E S TA D Í S T I C A I

8) ¿Cómo evaluaría usted a esta agencia? 1 2 1 – Bastante ordenada 2 – Percibe limpieza 3 – Ambiente moderno 4 – Comodidad al esperar 5 – Folletos disponibles

3

4

5

Desordenada No hay limpieza Ambiente antiguo Incomodidad No hay folletos

9) ¿Cómo percibe la seguridad en esta agencia bancaria? 1 – Óptima 3 – Regular 2 – Buena 4 – Deficiente 10) ¿Recuerda dónde se ubicaba el vigilante de la agencia bancaria? 1 – En la puerta de ingreso 3 – En el exterior 2 – En recepción al público 4 – En el interior 11) ¿Recuerda dónde se ubicaba el policía (PNP) en la agencia? 1 – En la puerta de ingreso 3 – En el exterior 2 – En recepción al público 4 – En el interior 12) ¿Cómo evaluaría usted a las siguientes personas de la agencia? CF C NO D 1 – ¿Los vigilantes son muy amables?

DF

2 – ¿Los policías son poco amables? 13) ¿El personal de la agencia usa fotocheck? 1 – Sí 2 – No 14) Si tuviera que escoger necesariamente un banco entre cada opción ¿cuál escogería? 1 – Crédito Machu Picchu 2 – Machu Picchu Interbank 3 – Scotia Bank Machu Picchu 4 – Machu Picchu Continental 5 – Continental Crédito 6 – Interbank Scotia Bank 15) ¿Es cliente a de alguno de los bancos mencionados en la pregunta anterior? 1 – Sí 2 – No

16) ¿En cuál o cuáles de ellos según prioridad? 1 2 1 – Machu Picchu 2 – Crédito 3 – Continental 4 – Scotia Bank 5 – Interbank 17) ¿Reside usted en el distrito de San Sebastián? 1 – Sí 2 – No z3 6 z

3


WA LT E R C É S P E D E S R A M Í R E Z

18) ¿Dentro de qué intervalos ubica su edad? 1 – menores de 18 años 4 – Entre 35 y 45 años 2 – Entre 18 y 25 años 5 – Entre 45 y 55 años 3 – Entre 25 y 35 años 6 – Más de 55 años 19) ¿Dentro de qué intervalos ubica su ingreso? 1 – menores de 600 soles 4 – Entre 2000 y 3000 soles 2 – Entre 600 y 1000 soles 5 – Entre 3000 y 4000 soles 3 – Entre 1000 y 2000 soles 6 – Más de 4000 soles 20) ¿Sexo? 1 – Masculino

2 – Femenino

Muchas gracias.

Entrevistador (a)

Fecha

z3 7 z

Hora



L e c c i ó n

4

1.4. APLICACIONES MATEMÁTICAS La información estadística de carácter numérico, utiliza las matemáticas cuando le desea dar a las observaciones un tratamiento en conjunto tanto muestral como poblacional, la gran mayoría de medidas estadísticas son obtenidas a través de las matemáticas. Algunas veces las cifras numéricas son muy grandes, de tal manera que para simplificarlas se utiliza la notación científica, quedando las mismas en miles o millones. Otra necesidad matemática es el redondeo de datos que se da generalmente a la parte decimal de toda cifra numérica, también la estadística utiliza las sumatorias en la mayoría de las medidas de resumen.

1.4.1. Notación científica Matemáticamente la notación científica es la representación de un número en un potencial que puede utilizar cualquier número como base, pero para la estadística se utiliza el potencial con base diez. Ejercicios resueltos: 1) Expresar científicamente con 2 cifras enteras, la siguiente cantidad: 23 475 684 543,129

Solución:

Se corre la cifra decimal de la posición actual a la nueva posición dejando 2 cifras enteras

23,475684543129 x109

z3 9 z


E S TA D Í S T I C A I

El potencial positivo es la cantidad de cifras que ha recorrido la coma hacia la izquierda. 2) Expresar científicamente 0,000000012952

con

2

cifras

enteras,

la

siguiente

cantidad:

Solución:

Se corre la cifra decimal de la posición actual a la nueva posición dejando 2 cifras enteras

12,952 x10 – 9 El potencial negativo es la cantidad de cifras que ha recorrido la coma hacia la derecha.

3) Expresar científicamente con 1 cifra entera, la siguiente cantidad: 2 928 452,1857

Solución:

Se corre la cifra decimal de la posición actual a la nueva posición dejando 1 cifra entera 2,9284521857x106 El potencial positivo es la cantidad de cifras que ha recorrido la coma hacia la izquierda.

4) Expresar científicamente 0,0000004571652

con

1

cifra

entera,

la

siguiente

cantidad:

Solución: Se corre la cifra decimal de la posición actual a la nueva posición dejando 1 cifra entera 4,571652 x10 – 7

El potencial negativo es la cantidad de cifras que ha recorrido la coma hacia la derecha.

5) Expresar científicamente con 3 cifras enteras, la siguiente cantidad: 221,457878 Solución:

221,457878 x100 El potencial es cero porque la coma ha permanecido en el mismo lugar. z4 0 z


WA LT E R C É S P E D E S R A M Í R E Z

6) ¿A qué número real le corresponde: 12,4589235 x 104? Solución: 124589,235

Cuando el exponente es positivo, la coma regresa a la derecha 4 posiciones. 7) ¿A qué número real le corresponde: 12,4589235 x 10

Solución:

0,00124589235

?

–4

Cuando el exponente es negativo, la coma regresa a la izquierda 4 posiciones. 8) ¿A qué número real le corresponde: 4 457 258,45 x 10

?

–5

Solución:

44,5725845

Cuando el exponente es negativo, la coma regresa a la izquierda 5 posiciones.

Resolver los siguientes ejercicios propuestos sobre notación científica: 1)

Representar científicamente con una sola cifra entera las siguientes cantidades:

a) 125,568912

Resp:

1,25568912 x 10 2

b) 0,002385789

Resp:

2,385789 x 10 – 3

c) 145 256 357 235,9

Resp:

1,452563572359 x 10 11

d) 0,125569

Resp:

1,25569 x 10 – 1

e) 0,00000000369

Resp:

3,69 x 10 – 9

f) 4,59823

Resp:

4,59823 x 10 0

2) Resolver las siguientes expresiones científicas:

a) 125568,912 x 10 – 4

Resp:

b) 25,289435 x 10 – 6

Resp: z4 1 z

12,5568912 0,000025289435


E S TA D Í S T I C A I

c) 8,912 x 10 5

Resp:

891 200

d) 68,14452 x 10 – 7

Resp:

0,000006814452

e) 2 912 x 10 6

Resp:

2 912 000 000

f) 0,94132 x 10 – 4

Resp:

0,000094132

1.4.2. Redondeo de datos Consiste en suprimir cifras que generalmente son decimales, algunas veces se suprimen todos los decimales quedando solo enteros, otras veces se dejan una o dos cifras decimales sin suprimir, de acuerdo con el criterio o por necesidad de quien realiza el redondeo. Al redondeo también se le conoce como aproximación de cifras decimales, para lo cual existen tres reglas que son: 1º Cuando la cifra posterior a la cifra a aproximar es mayor de 5, la cifra de aproximación aumenta en 1. 2º Cuando la cifra posterior a la cifra a aproximar es menor de 5, la cifra de aproximación queda igual. 3º Cuando la cifra posterior a la cifra a aproximar es igual a 5, la cifra de aproximación aumenta en 1 siempre y cuando sea cifra impar, en caso contrario no aumenta. Ejercicios resueltos: 1) Redondear a décimas las siguientes cantidades: 34,5723; 1,334529; 356,15; 26,05 y 26,0500001 Solución: a) 34,6 b) 1,3 c) 356,2 d) 26,0 e) 26,1

z4 2 z


WA LT E R C É S P E D E S R A M Í R E Z

En el caso “e”, a pesar de que la cifra de aproximación es par (0) y la posterior es 5, el 0 se ha convertido en 1, porque el otro uno que está al final de todo el número, hace que las centésimas sean mayor de 5. 2) Las ventas de 5 años del 2006 al 2010 de una empresa fueron las siguientes; 2006

56 458 279,20

2007

58 125 458,60

2008

65 945 258,50

2009

72 815 856,30

2010

81 125 456,90

Convertir científicamente las ventas en millones y redondearlas a enteros:

Solución: Años

Venta

Años

Venta en millones

2006

56,45827920 x 106

2006

56

2007

58,12545860 x 106

2007

58

2008

65,94525850 x 106

2008

66

2009

72,81585630 x 106

2009

73

2010

81,12545690 x 106

2010

81

Total

334,47030950 x 106

Total

334

Puede observar que las ventas en millones expresan lo mismo que la información original, con la diferencia de que las cifras redondeadas y en millones, facilitan el tratamiento estadístico porque son cifras más pequeñas.

1.4.3. Sumatoria (Σ) Es la representación ordenada de un conjunto finito de datos, que habrán de ser sumados, toda sumatoria se representa por la letra griega mayúscula, sigma. En estadística se estila que los límites de una sumatoria, sean a partir de 1 hasta el dato “n” inclusive, y pueden suprimirse del símbolo de sumatoria, cuando tales límites son conocidos. z4 3 z


E S TA D Ă? S T I C A I

Como cualquier valor numĂŠrico puede ser sumado, existen valores: variables, constantes y correlativos o Ă­ndices de la sumatoria; por consiguiente, se puede decir que existe un tipo de sumatoria para cada caso.

1.4.3.1. Sumatoria de una variable Se trata de valores que tienen diferentes cambios de magnitud, inclusive pueden hasta cambiar de signos. La sumatoria de una variable se define de la siguiente manera: đ??§đ??§

đ??˘đ??˘  !đ?&#x;?đ?&#x;?

Â

Donde:

đ??—đ??— đ??˘đ??˘  =  đ??—đ??— đ?&#x;?đ?&#x;? +  đ??—đ??— đ?&#x;?đ?&#x;? +  đ??—đ??— đ?&#x;‘đ?&#x;‘ +  .   .   . +  đ??—đ??— đ??§đ??§

Xi= Variable. i=

Ă?ndice.

Ejercicios resueltos: 1) Dado:

Xi

2

–3

4

1

–2

6

Yi

1

5

2

–4

–3

1

Hallar las siguientes sumatorias: a) ÎŁ Xi

b) ÎŁ Yi

c) ÎŁ (Xi + Yi)

d) Σ (2Xi – 3Yi)

e) ÎŁ Xi2

f) ÎŁ (Xi + Yi)2

g) ÎŁ 9 Xi

Solución: a) Σ Xi = 2 – 3 + 4 + 1 – 2 + 6 = 8 b) Σ Yi = 1 + 5 + 2 – 4 – 3 + 1 = 2 c) Σ (Xi + Yi) = (2 + 1) + (–3 + 5) + (4 + 2) + (1 – 4) + (– 2 – 3) + (6 + 1) = = 3 + 2 + 6 – 3 – 5 + 7 = 10 d) Σ (2Xi – 3Yi) = [2(2) – 3(1)] + [2(–3) – 3(5)] + [2(4) – 3(2)] + [2(1) – 3(–4)] + [2(– 2) – 3(–3)] + [2(6) – 3(1)] = 1 – 21 + 2 + 14 + 5 + 9 = 10 e) Σ Xi2 = 22 – 32 + 42 + 12 – 22 + 62 = 4 + 9 + 16 + 1 + 4 + 36 = 70 f) Σ (Xi + Yi) 2 = (2 + 1) 2 + (–3 + 5) 2 + (4 + 2) 2 + (1 – 4) 2 + (– 2 – 3) 2 + (6 + 1) 2 = = 32 + 22 + 62 – 32 – 52 + 72 = 9 + 4 + 36 + 9 + 25 + 49 = 132 g) Σ 9 Xi = 9(2) + 9(– 3) + 9(4) + 9(1) + 9(– 2) + 9(6) = 18 – 27 + 36 + 9 – 18 + 54 = 72 z4 4 z


WA LT E R C É S P E D E S R A M � R E Z

En este grupo de ejercicios no se han puesto los lĂ­mites, porque se entiende que Xi e Yi, adquieren los 6 valores, tal como se observa en la tabla que contiene a ambas variables. Resolver los siguientes ejercicios propuestos, utilizando sumatorias de una variable: 1) Dado,

Xi:

a) ÎŁ Xi b) ÎŁ Xi

2

c) ÎŁ 4 Xi

4, –3, 7, –8, 6, 3, 8, 1, –5 y 2.

Hallar:

Resp:

15

Resp:

277

Resp:

60

d) Σ (Xi – 1)

Resp:

5

e) Σ (Xi – 2)

Resp:

257

2

f) ÎŁ 6 Xi

Resp:

1 662

Resp:

1 310

Resp:

508

i) Σ (4 – Xi)

Resp:

25

j) ÎŁ (1 + Xi)

Resp:

25

2

g) Σ (5Xi2 – 5Xi) h) Σ 4(Xi2 – 10Xi)

1.4.3.2. Sumatoria de una constante Se trata de valores que tienen la misma magnitud, no presentan cambios. La sumatoria de una constante se define de la siguiente manera:

đ??§đ??§

Â

Donde: K=

đ??˘đ??˘  !đ?&#x;?đ?&#x;?

đ??Šđ??Š  =   đ??Šđ??Š + đ??Šđ??Š + đ??Šđ??Š+  .   .   .   = đ??§đ??§  đ??Šđ??Š

Constante

Ejercicios resueltos 1) Con los lĂ­mites del 1 al 8, resolver las siguientes sumatorias: a) ÎŁ 2

b) ÎŁ 9

c) Σ – 6

d) ÎŁ 17

z4 5 z

e) ÎŁ 22


E S TA D Ă? S T I C A I

SoluciĂłn:

a) Σ 2 = 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 = 16 b) Σ 9 = 9 + 9 + 9 + 9 + 9 + 9 + 9 + 9 = 72 c) Σ – 6 = – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 6 = – 48 d) Σ 17 = 17 + 17 + 17 + 17 + 17 + 17 +17 + 17 = 136 e) Σ 22 = 22 + 22 + 22 + 22 + 22 + 22 + 22 + 22 = 176 2) Con los límites del 15 al 21, resolver la sumatoria de la constante 28.

SoluciĂłn: ÎŁ 28 = 28 + 28 + 28 + 28 + 28 + 28 + 28 = 196

Resolver los siguientes ejercicios propuestos, utilizando sumatorias de una constante: 1) 2) 3) 4) 5)

Con Con Con Con Con

los los los los los

lĂ­mites lĂ­mites lĂ­mites lĂ­mites lĂ­mites

del del del del del

1 al 6, resolver la sumatoria de la constante 25. Resp: 1 al 9, resolver la sumatoria de la constante 19. Resp: 1 al 5, resolver la sumatoria de la constante 13. Resp: 10 al 19, resolver la sumatoria de la constante 23. Resp: 6 al 17, resolver la sumatoria de la constante 32. Resp:

150 171 65 230 384

1.4.3.3. Sumatoria de un Ă­ndice Se trata de valores que tienen cambios de magnitud de manera correlativa, obedeciendo a un mismo patrĂłn. La sumatoria de un Ă­ndice se define de la siguiente manera:

đ??§đ??§

Â

đ??˘đ??˘  !đ?&#x;?đ?&#x;?

đ??˘đ??˘  = đ?&#x;?đ?&#x;? + đ?&#x;?đ?&#x;? + đ?&#x;‘đ?&#x;‘+  .   .   . +   đ??§đ??§ Â

Donde:

i=

Ă?ndice

z4 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos

Resolver los siguientes ejercicios propuestos, utilizando sumatorias de un índice: 1) Si los límites van del 1 al 15, resolver: a) Σ i b) Σ 2i c) Σ (2i – 1)

z4 7 z

Resp: Resp: Resp:

120 240 225


E S TA D Í S T I C A I

1.4.3.4. Propiedades de sumatorias Dependiendo del tipo de sumatoria, las propiedades de estas son las siguientes: 1º La sumatoria de una constante es igual n veces la constante. ! ! !!

K = n K

2º La sumatoria de la suma y o diferencia entre constantes y/o variables, es igual a la suma y/o diferencia de las sumatorias de cada una de ellas. ! ! !!

(X ! − K + Y! ) =

! ! !!

X ! −

! ! !!

K +

! ! !!

Y!

3º La sumatoria del producto de una constante por una variable, es igual a la constante por la sumatoria de la variable. !

! !!

K X ! = K

! ! !!

X !

La sumatoria los primeros números naturales consecutivos, es igual a la mitad de (n) por (n + 1). !

! !!

i =

n (n + 1) 2

5º La sumatoria los primeros números naturales pares consecutivos, es igual a (n) por (n + 1). !

! !!

La sumatoria los primeros números naturales impares consecutivos, es igual a n2. !

2 i = n (n + 1)

! !!

(2 i − 1) = n!

La sumatoria de los cuadrados de los primeros números naturales consecutivos, es igual a [n (n + 1) (2n + 1)] / 6. !

! !!

i! =

n n + 1 (2n + 1) 6

8º La sumatoria de los cubos de los primeros números naturales consecutivos, es igual a [n (n + 1)] 2 / 22. ! ! !!

i! =

n n + 1 2

!

z4 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos

1) Dado: Xi

2

–3

4

1

8

–2

6

7

9

5

Yi

1

5

2

–4

7

–3

–1

3

4

6

Hallar las siguientes sumatorias: a) (Xi + Yi)

b) Σ (2Xi – 3Yi)

c) Σ (Xi – Yi)2

Solución: a) Σ Xi = 2 – 3 + 4 + 1 + 8 – 2 + 6 + 7 + 9 + 5 = 37 b) c)

Σ Yi = 1 + 5 + 2 – 4 + 7 – 3 – 1 + 3 + 4 + 6 = 20 Σ (Xi + Yi) = Σ Xi + Σ Yi = 37 + 20 = 57 Σ (2Xi – 3Yi) = 2 Σ Xi – 3 Σ Yi = 2(37) – 3(20) = 14 Σ Xi2 = 22 – 32 + 42 + 12 + 82 – 22 + 62 + 72 + 92 + 52 = 289 Σ Yi2 = 12 + 52 + 22 – 42 + 72 – 32 – 12 + 32 + 42 + 62 = 166 Σ Xi Yi = (2 x 1) + (–3 x 5) + (4 x 2) + (1 x –4) + (8 x 7) + (–2 x –3) + (6 x –1) + (7 x 3) + (9 x 4) + (5 x 6) = 2 – 15 + 8 – 4 + 56 + 6 – 6 + 21 + 36 + 30 = 134

Σ (Xi – Yi) 2 = Σ Xi2 – 2 Σ Xi Yi + Σ Yi2 = 289 – 2(134) + 166 = 187 42

2) Resolver:

∑i i=1

Solución: Fórmula: n (n +1) / 2 n = 42 Σ i = 42 (43) / 2 = 903 70

3) Resolver:

∑ 2i i=1

Solución: Fórmula: n (n +1) n = 70 Σ 2i = 70 (71) – 9 (10) = 4880

–n = 9

z4 9 z


E S TA D Í S T I C A I

Recuerde que se están sumando 70 (n) términos o números pares consecutivos del 1 al 70, pero como la sumatoria no incluye del 1 al 9, es necesario restar los términos que no se incluyen. 130

4) Resolver:

∑ (2i −1)

i=105

Solución: Fórmula: n2 n = 130 – n = 104 Σ (2i – 1) = 1302 – 1042 = 6 084 5) Hallar la sumatoria de los siguientes números:

1 + 2 + 3 +……. + 156

Solución: Fórmula: n (n +1) / 2 n = 156 Σ i = 156 (157) / 2 = 12 246 6) Hallar la sumatoria de los siguientes números:

76 + 78 + 80 +……. + 280

Solución: Fórmula: n (n +1) n = 280 / 2 = 140 Σ 2i = 140 (141) – 37 (38) = 18 334 7) Hallar la sumatoria de los siguientes números:

– n = 74 / 2 = 37

7 + 9 + 11 +……. + 29

Solución: Fórmula: n2 n = (29 + 1) / 2 = 15 Σ (2i – 1) = 152 – 32 = 216

–n = (5 + 1) / 2 = 3

En los ejercicios 6 y 7, el valor de n se halla de manera inversa a la sumatoria de cada caso. 8) Hallar la sumatoria de los siguientes números:

520 + 540 + 560 +……. + 2080

Solución: Para darle solución a este ejercicio, primero se debe convertir a uno de los casos dados. (52 + 54 + 56 +……+ 208) x 10 Fórmula:

n (n +1)

n = 208 / 2 = 104

Σ 2i = 104 (105) – 25 (26) =

(10 270) x 10

z5 0 z

– n = 50 / 2 = 25 = 102 700


WA LT E R C É S P E D E S R A M � R E Z

9) Hallar la sumatoria de los siguientes números: 0,051 + 0,053 + 0,055 +‌+ 0,157 Solución: Para darle solución a este ejercicio, primero se debe convertir a uno de los casos dados. (51 + 53 + 55 +‌‌+ 157) x 10–3 Fórmula:

n2

n = (157 + 1) / 2 = 79

Σ (2i – 1) = 792 – 252 = (5 616) x 10–3

–n = (49 + 1) / 2 = 25

= 5,616

10) Si la suma de los primeros nĂşmeros naturales consecutivos, es 144 453, ÂżcuĂĄl es el valor de n? SoluciĂłn: FĂłrmula:

n (n +1) / 2

n =

n (n +1) / 2 = 144 453;

ÎŁ i = 144 453

?

n2 + n = 288 906;

n2 + n – 288 906 = 0

La fĂłrmula de una ecuaciĂłn de segundo grado es:

−  đ?‘?đ?‘?  ¹  đ?‘?đ?‘? ! −  4  đ?‘Žđ?‘Ž  đ?‘?đ?‘? −  1  ¹  1! −  4(1)(−288  906) , al  reemplazar  los  valores, se  tiene:   2  đ?‘Žđ?‘Ž 2(1) đ??§đ??§  =  Â

−  1  ¹  1! + 1  155  624 −  1  ¹  1  155  625 −  1 + 1  075 =  =  =   đ?&#x;“đ?&#x;“đ?&#x;“đ?&#x;“đ?&#x;“đ?&#x;“ 2 2 2

Un mĂŠtodo prĂĄctico para resolver este tipo de ecuaciones es sacando raĂ­z cuadrada del valor conocido, tomando solo la parte entera, sin redondeo.

n = 288 906 = 537, 4997674 = 537 Resolver los siguientes ejercicios propuestos, utilizando las propiedades de sumatorias: 1) Hallar las siguientes sumatorias, utilizando los datos de la tabla adjunta: Yi

5

4

2

3

8

6

9

Zi

6

1

2

5

–1

7

4

a) (Yi + Zi)

Resp:

61 52

b) Σ (4Yi – 4Zi)

Resp:

c) Σ (Yi – Zi)2

Resp: z5 1 z

121


E S TA D Í S T I C A I

125

∑i

2) Resolver: I=15 Resp: 7 770 51

3) Resolver:

∑ 2i I=33

Resp: 1 596 56

4) Resolver:

∑ (2i −1) I=15

Resp:

2 940

5) Hallar la sumatoria de los siguientes números: 19 + 20 + 21 + 22 +……. + 135 Resp.

9 009

6) Hallar la sumatoria de los siguientes números: 706 + 708 + 710 +……. + 720 Resp:

5 704

7) Hallar la sumatoria de los siguientes números: 37 + 39 + 41 + 43 +……. + 63 Resp: 8) Hallar la sumatoria de los siguientes números:

700

3,21 + 3,23 + 3,25 +……. + 4,11

Resp: 168,36 9) Hallar la sumatoria de los siguientes números:

0,001 + 0,002 + 0,003 +…….+ 0,17

Resp: 14,535 10) Si la suma de los primeros números naturales consecutivos, es 7 875, ¿cuál es el valor de n? Resp:

125

11) Si la suma de los primeros números naturales impares consecutivos, es 70 756, ¿cuál es el valor de n? Resp: 12) Si: Σ Xi = 32

Σ Xi2 = 321

Hallar Σ [Xi (Xi – 4)]

13) Si: Σ Zi = 16

y

y

266

Resp:

193

Resp:

201

Σ Zi2 = 201

Hallar Σ (Zi – 4)2; con los límites del 1 al 8 z5 2 z


WA LT E R C É S P E D E S R A M Í R E Z

AUTOEVALUACIÓN Nº 1 1) ¿Cuál de los siguientes conceptos se refiere al marco referencial? A) Procedimientos y metas del investigador C) Obtener datos más importantes E) Obtener una muestra de una población

B) Límites de la investigación D) Dar solución a un problema muestral

2) Una población es el . . . . . . . . . . . de los datos, de la cual se ………….. una muestra. A) Marco / Investiga D) Censo / muestrea

B) Estadígrafo/ procesa E) Estadígrafo / obtiene

C) Universo / obtiene

3) Los investigadores prefieren trabajar con muestras, para: A) Una investigación con variables C) Procesar datos E) Hacer un muestreo

B) Ahorrar tiempo y costo D) Calcular medidas

4) Un estadígrafo se obtiene al: A) Procesar una medida estadística de resumen C) Determinar los límites de una investigación E) Todas las respuestas anteriores son correctas

B) Desarrollar un proceso de investigación D) Clasificar los tipos de datos

5) Determine a cuál de los tipos de variables pertenece: “Las monedas de menor circulación”. A) Ordinal

B) Nominal

C) Discreta

D) Continua

E) Cuantitativa

6) Determine a cuál de los tipos de variables pertenece: “La lista de postulantes a una beca”. A) Ordinal

B) Nominal

C) Discreta

D) Continua

E) Cuantitativa

7) Determine a cuál de los tipos de variables pertenece: “La capacidad de la biblioteca de la Facultad”. A) Ordinal

B) Nominal

C) Discreta

D) Continua

E) Cualitativa

8) El tipo de pregunta utilizado en una encuesta que define los extremos y deja al encuestado determinar la intensidad de su respuesta, dentro de una escala, se llama: A) Likert

B) Thurstone

C) Dicotómica cerrada D) Escalar unipolar E) Diferencial semántico

z5 3 z


E S TA D Í S T I C A I

9) Si tuviera que escribir científicamente con tres cifras enteras el siguiente número: 1,25966. ¿Cuál sería el exponente de base 10? A) 3 B) – 3

C) 2

D) 1

E) –2

10) ¿Qué número es el que se ha escrito científicamente como 2,3958 x 10– 4? A) 0,0023958

B) 0,23958

C) 2395,8

D) 0,00023958

E) 0,000023958

11) Redondee a décimas, las siguientes cantidades: 34,71234; 0,45; 22,85000002 A) 34,7; 0,5; 22,8

B) 34,7; 0,4; 22,8 C) 34,7; 0,5; 22,9 D) 34,7; 0,4; 22,9 E) 34,8; 0,5; 22,8

12) Con: Σ Yi2 = 261,

Σ Yi Zi = 45,

Σ Zi2 = 246.

Hallar: Σ (5Yi – 5Zi)2 A) 507

B) 15

C) 4 785

D) 375

E) 10 425

41

13) Resolver: A) 358

∑ (2i −1)

i=37

B) 1 299

C) 1 681

D) 385

E) 2 977

14) Hallar la sumatoria de los siguientes números: 1 852, 1 854, 1 856,……., 2010 A) 308 960

B) 154 480

C) 1 011 030

D) 614 058

E) 617 760

15) Hallar la sumatoria de los siguientes números: 0,091 + 0,092 + 0,093 +…+ 0,21 A) 18,06

B) 18 060

C) 1,806

D) 180,6

E) 1 806

Respuestas de control 1. B, 2. C, 3. B, 4. A, 5. A, 6. B, 7. C, 8. E, 9. E, 10. D, 11. D, 12. E, 13. D, 14. B, 15. A

z5 4 z


WA LT E R C É S P E D E S R A M Í R E Z

GLOSARIO Caracterizar la muestra.

Es cuando una muestra adquiere las mismas características de una población (Deducción).

Caracterizar la población.

Es cuando se asume que una población tiene las mismas características de una muestra (Inducción).

Competidor.

Es una empresa u organización que actúa en el mismo mercado que otras empresas, generando competencia entre ellas.

Conjunto finito.

Es un grupo limitado de datos u observaciones; es decir, que un conjunto finito permite contar todos sus elementos.

Experimentación.

Significa probar diferentes acciones, con el propósito de comparar los resultados obtenidos para elegir el más apropiado.

Medidas de resumen.

Son todas aquellas medidas estadísticas tanto de posición o centralización como las de variación o dispersión que resumen de alguna manera las características de una muestra o población. Ejemplo: Media Aritmética, Mediana, Varianza, Coeficiente de Variación, etc.

Pregunta cerrada.

Es un tipo de pregunta utilizada en las encuestas, que se caracteriza por no dejar libertad al informante a contestar de manera abierta, solo debe contestar las posibles respuestas contempladas dentro de ella.

EXPLORACIÓN ON LINE http://es.wikipedia.org/wiki/Variable_estad%C3%ADstica http://recursostic.educacion.es/descartes/web/materiales_didacticos/iniciacion_estadististica_fjgarcia/01VariablesEstadisticas.htm http://www.unavarra.es/estadistica/I.T.A./Curso%202005-06/APUNTES/temas%201%20y% 202.pdf http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html http://ag-exactas.wikidot.com/sumatorias z5 5 z



s e g u n d a

UNIDAD Uso de los Datos Estadísticos

Estadísticas para información: textos, tabulados, gráficos Estadísticas para investigación: Tablas de distribuciones de frecuencias, gráficos


OBJETIVO (S) GENERAL Aprender que los datos estadísticos tienen dos usos totalmente diferentes, ya que se pueden utilizar como estadística para información y como estadística para investigación. Las estadísticas para información es de uso público, que son preparadas para todos incluyendo a los que no conocen de Estadística; estas informaciones, obtenidas de alguna fuente, son publicadas ordenadamente en cuadros y gráficos. En cambio, para comprender las Estadísticas para Investigación, las personas deben de conocer sobre esta asignatura, porque utiliza procedimientos y medidas estadísticas propias.

ESPECÍFICOS • Conocer que una vez recogida la información de alguna fuente, existe un área estadística que se encarga de publicar los datos recopilados, con el cuidado especial de que cualquier persona pueda entenderlos. • Saber que una vez recogida la información de alguna fuente, existe otra área estadística que se encarga de prepararlos para el análisis, ordenando la información en tablas de distribución de frecuencias además de construir algunos gráficos de uso estadístico.


L e c c i ó n

1

2.1. ESTADÍSTICAS PARA INFORMACIÓN

Existen instituciones públicas y/o privadas que encargan de recolectar información, con el objeto de ordenarlas para publicarlas manteniendo informado a un determinado público. Por esta razón, existen revistas periódicas de diferentes especialidades, que se encargan de publicar: el movimiento bursátil de una ciudad, el movimiento migratorio del campo a la ciudad o de la ciudad al exterior, la producción minera o industrial, el PBI, etc. Este tipo de publicación se dice que posee información estadística por el volumen de cifras numéricas que incluye, además es conocida como información estadística de uso público, por que el lector no necesita conocer de Estadística, para comprender sobre lo que se está informando, es decir, que la información se prepara de tal manera que cualquiera pueda entenderla con facilidad.

En esta lección no se incluyen ejercicios para el alumno, porque el propósito de esta lección es hacer estadística solamente para informar, no está hecha para la investigación, asunto que si se verá en la siguiente lección. Además por la gran cantidad de información numérica que albergan los tabulados o cuadros, hacen que el trabajo sea muy laborioso y tengan una dedicación especial, esto fácilmente se puede lograr con programas informáticos o algún otro software como el SPSS (Statistical Package for the Social Sciences), que es un programa estadístico informático muy usado en las ciencias sociales y por las empresas de investigación de mercado. z5 9 z


E S TA D Í S T I C A I

La Estadística de uso público tiene diferentes presentaciones, que se incluyen en una misma publicación, con el propósito de que sea más comprensible y tenga vistosidad combinando colores con figuras elaboradas con esmero. Entre las principales formas de presentación de la estadística para informar al público, se tiene:

2.1.1. Textos Una de las formas de presentación de información es mediante textos, que consisten en informes o artículos sobre datos numéricos, resaltando o comentando todo aquello que se considere relevante; otra de la formas de utilizar los textos es para explicar las variaciones de las cifras en el tiempo, o para explicar el comportamiento de una determinada variable; también se utiliza para resumir toda la información e incluye comparaciones con otras cifras ya sea del mismo sector u otras cifras de periodos precedentes.

Ejemplos sobre texto Ejemplo 1 El Producto Bruto Interno (PBI) de la región Cusco fue de 2 983 millones de nuevos soles, ligeramente mayor que el del año anterior. Representa el 2,45% del PBI nacional, cifra que debe ser comparada con la del porcentaje de la población que alberga en la región que es del 4,52%. Ejemplo 2: Los empresarios encuestados a la pregunta ¿Cree Usted que el Tratado de Libre Comercio con China tendrá un efecto positivo en las ofertas de los productos de las pymes de Gamarra? De los 193 que participaron de la encuesta, solo 10 (5,19%), manifestaron algún tipo de concordancia, mientras que 178 (92,22%), dijeron que discrepaban del efecto positivo en el volumen de productos ofertados y 5 empresarios (2,59%) estaban indecisos. La discrepancia elevada del 92,22% sobre el efecto positivo del TLC con China, demuestra claramente que las ofertas de productos de las pymes tendrán un efecto más bien negativo. La gran mayoría está segura que los productos ofertados en Gamarra, se verán afectados fuertemente de manera negativa, por esta razón el hecho de no haberlos convocado a conversar sobre la implicancia del tratado tal como ellos lo perciben, para darle algún tipo de solución a este problema, demuestra claramente que el gobierno actual no respeta la posición de estos empresarios.

2.1.2. Tabulados o cuadros Otra de las formas de presentación de información es mediante tabulados o cuadros, que pueden albergar gran cantidad de información numérica.

z6 0 z


WA LT E R C É S P E D E S R A M Í R E Z

Con relación a como se elabora un cuadro, no existe una norma universal aunque han existido intentos de universalizar la forma de cómo se debe elaborar un tabulado de cifras, encontrándose las siguientes consideraciones: 1º Se debe usar el sentido común. 2º Considerar el punto de vista del usuario, comprenda que no es estadístico por ello debe ser de fácil entendimiento del tema que se publica. Por lo general, los tabulados deben tener las siguientes partes: a) Número: Es un valor correlativo que se emplea en toda publicación que cuenta con más de un tabulado, este número va a facilitar su ubicación en la publicación. b) Título: Debe indicar las características del tabulado, la forma como se presenta la información (por…… según……), el lugar donde se observó el fenómeno o dato y la fecha o periodo de referencia. c) Encabezamiento: Expresa todo aquello señalado en el título como “por” y muestra la información indicada en las columnas. d) Columna Matriz: Expresa todo aquello señalado en el título como “según” y muestra la información indicada en las filas. e) Cuerpo: Está compuesto por celdas imaginarias por el cruce de filas con columnas, donde van las cifras que se publican, cuidando que ninguna celda quede vacía. Algunas apreciaciones en el cuerpo del tabulado: - No hay información (- - -) - Información no disponible (n. d.) o también (. . .) - Información muy pequeña (0) ó (0,0) ó (0,00) según hayan decimales. - Información Preliminar o Provisional (P) es información sujeta a ser cambiada - Información Revisada (R) es información definitiva. f) Pié: Es la parte final del tabulado donde se señala la fuente, las llamadas (a/, */, etc.) y alguna nota explicadora en caso de ser necesario. Dependiendo del contenido del tabulado, puede presentarse una o más variables.

2.1.2.1. Tabulados unidimensionales Son tabulados o cuadros que contienen una sola variable, por lo consiguiente no tienen encabezamiento y en el título solo lleva el término “según” que expresa lo señalado en la matriz por filas.

z6 1 z


E S TA D Í S T I C A I

Ejemplos sobre tabulados unidimensionales: Ejemplo 1: Volumen de importaciones de trigo según países de origen En toneladas métricas – Perú 2011 Países de Origen

Total Canadá Estados Unidos Argentina México

T. M.

1 625 736 784 625 118 98

145 095 353 143

%

100,00 48,23 38,45 7,28 6,04

Fuente: Ministerio de Agricultura Ejemplo 2: Volumen de Exportaciones de Cobre según países de destino En millones de US dólares – Perú 2011

Países de Destino

Dólares

%

Total

1 486,8

100,00

1 109,5 104,3 92,5 59,4 30,7 90,4

74,62 7,02 6,22 4,00 2,06 6,08

Estados Unidos Italia Reino Unido Brasil Taiwán Otros

Fuente: Ministerio de Agricultura.

Fuente: Ministerio de Agricultura 2.1.2.2. Tabulados bidimensionales Son tabulados o cuadros de dos variables, una variable queda representada en el encabezamiento y la otra variable se expresa en la matriz. Las cifras representadas en las celdillas representan las dos variables a la vez, excepto los totales por cada variable.

z6 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejemplos sobre tabulados bidimensionales: Ejemplo 1: Ahorro en el Sistema Financiero por Modalidad de Depósito según Años Perú, 2000 - 2010, en millones de nuevos soles

Años 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Modalidad de Depósito Total 48 443 51 750 57 365 64 330 70 411 86 336 104 410 133 242 135 094 162 966 179 223

Ahorros 2 766 2 985 3 090 3 615 4 201 5 767 6 658 8 543 11 667 13 824 15 207

A Plazos

A. F. P.

M. Extranjera

Otros

2 103 2 482 3 016 3 116 4 575 6 630 7 318 10 972 15 506 17 666 27 559

9 599 12 350 15 754 21 844 25 651 32 223 45 547 60 406 49 380 68 595 79 128

32 900 32 555 34 273 34 751 34 784 39 809 42 485 48 590 54 930 57 108 55 315

1 075 1 378 1 232 1 004 1 200 1 907 2 402 4 731 3 611 5 773 2 014

Fuente: Banco Central de Reserva del Perú

Ejemplo 2:

z6 3 z


E S TA D Í S T I C A I

2.1.2.3. Tabulados tridimensionales Son tabulados o cuadros que contienen tres variables a la vez, dos variables pueden representarse en el encabezamiento y la otra variable en la columna matriz o viceversa. Las cifras en cada celdilla representan a las tres variables a la vez, excepto las de los totales. Dentro de estos tabulados hay totales que expresen dos variables, también hay totales que expresan solo una, dependiendo a qué nivel lleve el cruce de columna (por) con la fila (según). En lo posible hacer que los tabulados no muestren más de tres variables a la vez, porque en la práctica lejos de ser útil, tienden a crear confusión en el lector.

Ejemplos sobre tabulados tridimensionales: Ejemplo 1: Población Económicamente Activa (PEA) por Años y Sexo según Países América Latina, 2010 – 2020, en miles de personas (P)

Nota: Incluye a la población de 15 años a más. Fuente: Comisión Económica para América Latina z6 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejemplo 2

z6 5 z


E S TA D Í S T I C A I

2.1.3. Gráficos Son esquemas que generalmente se grafican sobre el primer cuadrante de los ejes cartesianos, con excepción de las gráficas circulares o gráficas de pastel, que representan las proporciones con ángulos. Los gráficos se deben hacer con especial cuidado y tener una representación con estética y de fácil interpretación, porque toda publicación además de ser clara debe agradar al lector, precisamente un gráfico con colores alegres, es una de las formas de atraer la atención para hacer que la publicación sea interesante. Un gráfico puede representar una o más variables, además de los diagramas circulares, estos puede ser: lineales, por barras o pictogramas.

2.1.3.1. Gráficos Lineales Son puntos o pares ordenados que se obtienen al cruzar valores definidos de la abscisa con la ordenada, tales puntos son unidos con un segmento en forma consecutiva, del primero al último. En el gráfico cada grupo de segmentos unidos, representa una variable. Ejemplos sobre Gráficos Lineales Ejemplo 1

z6 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejemplo 2

2.1.3.2. Gráficos por Barras Son barras graficadas tomando como base el eje de la abscisa a la altura de la ordenada según el dato a graficar. Este tipo de gráfico puede representar una o más variables, las cuales para ser diferenciadas, utilizan diferentes colores. Ejemplos sobre Gráficos por Barras: Ejemplo 1

z6 7 z


E S TA D Ă? S T I C A I

Ejemplo 2

Ejemplo 3

z6 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejemplo 4

2.1.3.3. Gráficos Circulares Son gráficos que representan las proporciones de una variable con ángulos. Se conocen como gráficos de pastel porque tienen una forma similar al pastel. Ejemplo sobre Gráfico Circular:

z6 9 z


E S TA D Ă? S T I C A I

2.1.3.4. Pictogramas Son grĂĄficos que representan figuras relacionadas con los datos. Ejemplos sobre Pictogramas: Ejemplo1

Ejemplo 2

z7 0 z


L e c c i ó n

2

2.2. ESTADÍSTICAS PARA INVESTIGACIÓN En esta lección se van a considerar solamente las estadísticas unidimensionales, porque los datos que se compilan además de ser ordenados para ver su composición, son preparados para continuar con su tratamiento de investigación. Como su nombre lo indica, el objetivo de esta lección, es la de dejar toda la información preparada, de tal manera que se pueda realizar un análisis de los datos que se investigan para tomar decisiones. Para analizar la información recogida de las fuentes, en primera instancia la Estadística utiliza dos herramientas de bastante utilidad; una es representar los datos en cuadros con características especiales, que se denominan Tablas de Distribución de Frecuencias; la otra herramienta es representar los datos en gráficos que permiten visualizar la forma y la composición de las observaciones. Para entender la presentación de esta forma de ordenamiento de los datos, es necesario tener los conocimientos básicos de Estadística, porque no fueron preparados para ser publicados o tengan uso público, sino más bien para uso o tratamiento estadístico.

2.2.1. Tablas de Distribución de Frecuencias Las tablas estadísticas representan el número de observaciones según el recorrido de la variable estadística; estas tablas, son utilizadas para analizar el comportamiento de la variable, además de la simple inspección que representa el presentarla de manera ordenada.

z7 1 z


E S TA D Í S T I C A I

El contenido de todas las tablas de distribución de frecuencias es el mismo, independientemente del tipo de variable y cómo está organizada. Las tablas pueden ser confeccionadas u organizadas: por lista o por intervalos de clases. Todas las tablas de distribución de frecuencias, se estructuran de la siguiente manera: 1º Columna principal o matriz: Contiene la variable estructurada por lista o por clase, dependiendo de la variable. 2º Tabulación: Está constituida por: tarjas, Check, palitos, etc. por cada vez que se repite o presente el dato, las repeticiones o presentaciones son conocidas en las tablas como frecuencias. Cada tarja o palito representa un dato y a esta columna se trasladan todos los datos, uno por uno hasta el último. 3º Frecuencia Absoluta (fi): Es la expresión numérica de la tabulación, la frecuencia absoluta es la expresión del número de repeticiones o simplemente frecuencias, que tiene un dato o una clase. Es también el número de veces que aparece el dato señalado en la columna matriz, que corresponde a una muestra o población. 4º Frecuencia Relativa Absoluta (hi): Es la proporción de observaciones que corresponden a un dato o a una clase, es la probabilidad de que el valor o magnitud de referencia ocurra. La frecuencia relativa absoluta, se obtiene al dividir la frecuencia absoluta entre la suma de todas las frecuencias o número total de datos (hi = fi / N). Los valores absolutos representan las frecuencias y las proporciones de un solo dato o una sola clase. 5º Frecuencia Acumulada (Fi): Es la acumulación directa de las frecuencias absolutas hacia abajo, conforme se cambie de dato o de clase. 6º Frecuencia Relativa Acumulada (Hi): Es la proporción de observaciones absolutas que se van agregando dato por dato o clase por clase. La frecuencia relativa acumulada hacia abajo también se puede obtener al dividir la frecuencia acumulada entre la suma de todas las frecuencias o número total de datos. (Hi = Fi / N). Si la variable de los valores acumulados hacia abajo es numérica, la frecuencia acumulada absoluta y relativa son denominadas valores “menos” o “menores de”. En cambio si es variable cualitativa o no numérica, la frecuencia acumulada absoluta y relativa son denominadas valores “antes de”. 7º Frecuencia Acumulada Inversa (Fi ↑ ): Es la acumulación de las frecuencias absolutas de abajo hacia arriba, conforme se cambie de dato o de clase. 8º Frecuencia Relativa Acumulada Inversa (Hi ↑ ) : Es la proporción de observaciones absolutas que se van agregando dato por dato o clase por clase de abajo hacia arriba. La frecuencia relativa acumulada inversa también se puede obtener al dividir la frecuencia acumulada inversa entre la suma de todas las frecuencias o número total de datos. (Hi ↑ = Fi ↑ / N). z7 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Si la variable es numérica los valores acumulados hacia arriba son denominados valores: “más” o “mayores de” y si la variable es cualitativa son denominados “después de”. 9º Marca de Clase (Xi): Se calcula solo en las tablas organizadas por clases, porque en las tablas organizadas por lista la marca de clase se encuentra en la columna matriz o principal. La marca de clase es el valor que representa a toda la clase y se obtiene al dividir entre 2 la suma de sus límites (Xi = [Li + Ls] / 2).

Todas las frecuencias relativas se expresan en la tabla en tanto por uno, pero si usted desea, puede multiplicar este valor por cien y lo tiene en tanto por ciento, de esta manera podrá entender mejor los valores relativos.

2.2.1.1. Distribución de Frecuencias de Variables Cualitativas En las tablas de distribución de frecuencias, este tipo de variable solo se organiza por lista, en los casos de que la lista sea muy amplia, se agrupan estas variables según: categorías, tipos, géneros, etc. de tal manera que la lista se hace más pequeña. No es recomendable trabajar con una lista muy pequeña ni mucho menos con una amplia, en lo posible la distribución de frecuencias debe hacerse entre 5 y 12 nombres o categorías. Ejercicios resueltos 1) Una encuesta dirigida a 50 alumnos, para conocer cuál es su deporte de preferencia, los resultados fueron los siguientes: Futbol, vóley, gimnasia, futbol, natación, vóley, básquet, box, futbol, futbol, vóley, básquet, futbol, vóley, futbol, natación, básquet, futbol, vóley, futbol, básquet, natación, vóley, futbol, vóley, gimnasia, futbol, futbol, vóley, básquet, futbol, vóley, futbol, básquet, futbol, básquet, box, futbol, básquet, futbol, tenis, futbol, natación, básquet, futbol, vóley, gimnasia, vóley, básquet, vóley. Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos alumnos prefieren gimnasia? c) ¿Qué porcentaje de alumnos prefieren vóley? d) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran antes de la natación? e) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran antes del futbol?

z7 3 z


E S TA D Í S T I C A I

f) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran después del box? g) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran después del básquet? Solución: La variable es cualitativa, por lo tanto la tabla será construida por lista, en orden alfabético que es lo usual.

b) ¿Cuántos alumnos prefieren gimnasia?

3 alumnos

c) ¿Qué porcentaje de alumnos prefieren vóley?

24%

d) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran antes de la natación? 33 alumnos e) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran antes del futbol? 24% f) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran después del box? 38 alumnos g) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran después del básquet? 80%. 2) Una encuesta dirigida a 140 clientes de una organización, se les consultó que escogieran entre las siguientes opciones, ¿cuál de ellas en el servicio al cliente consideraban como más importante? 1. 2. 3. 4. 5. 6.

Ambiente limpio Atención agradable Atención ordenada Comodidad en la espera Equipos modernos Servicio rápido z7 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Las respuestas fueron las siguientes:

Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos clientes prefieren equipos modernos? c) ¿Qué porcentaje de clientes prefieren ambiente limpio? d) Según el ordenamiento ¿cuántos clientes prefieren los tres primeros? e) Según el ordenamiento ¿qué porcentaje de clientes prefieren los cuatro primeros? f) Según el ordenamiento ¿cuántos clientes prefieren los tres últimos? g) Según el ordenamiento ¿qué porcentaje de clientes prefieren los dos últimos? h) ¿Qué opción tiene la mayor preferencia? i) ¿Qué opción tiene la menor preferencia? Solución: En la construcción de la tabla de variable cualitativa, la lista tendrá el orden tal como fueron codificadas las opciones.

b) ¿Cuántos clientes prefieren equipos modernos?

18 clientes.

c) ¿Qué porcentaje de clientes prefieren ambiente limpio?

15,71%

d) Según el ordenamiento ¿cuántos clientes prefieren los tres primeros? 90 clientes e) Según el ordenamiento ¿qué porcentaje de clientes prefieren los cuatro primeros? 78,57%

z7 5 z


E S TA D Í S T I C A I

f) Según el ordenamiento ¿cuántos clientes prefieren los tres últimos? 50 clientes g) Según el ordenamiento ¿qué porcentaje de clientes prefieren los dos últimos? 21,43%. h) ¿Qué opción tiene la mayor preferencia?

i) ¿Qué opción tiene la menor preferencia?

Atención ordenada. Servicio rápido.

Resolver los siguientes ejercicios propuestos, utilizando Distribución de Frecuencias de Variable Cualitativa: 1) En una encuesta a 80 vecinos de una localidad, se les consultó que en la próxima elección vecinal, ¿qué exigiría usted como prioritario a los candidatos? Las respuestas fueron: 1. Sin corrupción, 2. Más educación, 3. Seguridad ciudadana, 4. Manejo presupuestal, 5. Más empleo, 6. Más obras, 7. Servicios asistenciales, 8. Más hospitales. Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine el porcentaje de la opción de mayor prioridad: 2526425381 2574621563

Resp:

4523671475 8452874523

8652314125 6584123514

4158532541 7852145665

Más empleo (5) = 22,50%

2) En una encuesta a 50 consumidores de una localidad, se les consultó, ¿qué era lo que más le gustaba de un producto alimenticio? Las respuestas fueron: 1. Sea económico, 2. Color, 3. Sabor, 4. Presentación, 5. Tamaño, 6. Calidad. Con las siguientes respuestas, construya una tabla de distribución de frecuencias y determine cuál es la característica que menos gusta de un producto alimenticio: 1563241563 6535142635 5636513624 1445126351

Resp:

1245114511

Color (2) = 10%.

3) En una encuesta a 60 vecinos de una manzana, se les consultó, ¿cuál era el medio más efectivo para evitar robos en los hogares? Las respuestas fueron: 1. Rejas, 2. Policías, 3. Vigilantes, 4. Serenazgo, 5. Rondas vecinales.

z7 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine cuál es el medio más efectivo para evitar robos en los hogares: 1245331252 3152412352

Resp:

1212541232 1514215323

3251412512 1412513514

El medio más efectivo está entre: Rejas (28,33%) y Policías (26,67%)

4) En una encuesta a 120 escolares, se les consultó, ¿qué esperaban de sus profesores? Las respuestas fueron: 1. Mayor explicación a los temas, 2. Menos tareas, 3. Trato amble, 4. Señalar los temas de evaluación, 5. Puntualidad, 6. Trabajos grupales. Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine la frecuencia de la opción de lo que menos esperan de los profesores: 2625463365 2152241515 3225214636

Resp:

2123654236 3625412365 5143625135

5123212564 2661256144 1142632513

3652145236 2365214526 2561235124

Señalar los temas de evaluación = 13

5) Ante la consulta a 200 alumnos ¿qué taller le gustaría aprender?, si tuviera que escoger entre los siguientes tipos de taller artístico que ofrece el colegio: 1. Pintura, 2. Baile, 3. Teatro, 4. Música, 5. Manualidades, 6. Dibujo, 7. Letras. Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine las proporciones de alumnos de los dos talleres más solicitados: 2 3 7 3 1

5 2 4 6 4

1 6 5 5 2

2 5 6 2 5

Resp:

4 1 2 3 6

7 4 3 6 2

2 2 6 2 3

5 5 2 1 2

6 7 1 4 5

3 4 2 2 7

2 1 5 5 2

3 2 2 7 5

6 5 1 4 6

5 3 4 1 2

7 6 5 2 3

4 5 3 5 6

1 4 2 6 2

2 7 6 3 3

5 1 5 2 2

3 2 4 6 5

6 5 7 2 4

2 2 1 1 7

5 3 2 4 1

1 6 4 5 2

4 5 5 6 1

5 2 7 2 2

3 4 5 6 6

2 1 6 2 2

6 2 3 5 3

7 5 2 4 5

1 4 5 7 2

2 1 4 1 6

4 2 1 7 2

5 3 3 5 1

2 6 2 2 4

3 2 5 6 4

2 1 4 2 2

2 4 7 3 5

5 5 2 5 1

2 2 1 2 2

Baile (2) = 28% y Manualidades (5) = 18,5%

2.2.1.2. Distribución de Frecuencias de Variables Discretas Las variables discretas tienen la particularidad de organizarse en tablas de distribución de frecuencias, tanto por lista como por intervalos de clases; cuando la lista es muy amplia, se agrupan los datos en intervalos para hacerla más pequeña la tabla, porque como ya se ha manifestado, no es recomendable trabajar con una lista muy pequeña ni mucho menos con una amplia, en lo posible la distribución de frecuencias debe hacerse con una tabla que contenga como mínimo 5 líneas y como máximo 12.

z7 7 z


E S TA D Í S T I C A I

Cuando se confecciona una tabla por lista, la columna principal lleva los valores de la lista de datos de la variable discreta, luego se continúa con el tabulado y lo demás. En cambio cuando se organiza una tabla con variable discreta por clase, para construir la columna principal, se deben dar los siguientes pasos: 1º Recorrido de la Variable (L): Se debe conocer que amplitud de datos de van a dividir en partes o clases, con la siguiente fórmula: L = Dato máximo – Dato mínimo + 1 2º Número de Intervalos de clase (k): Representa la cantidad de clases, en que se va a distribuir la tabla. Generalmente el número de clases se determina según la regla de Sturges redondeada al número entero más próximo. El número de clase se define de la siguiente manera: k = 1 + 3,322 log N 3º Tamaño de clase (e): Es la misma amplitud que van a tener cada una de las clases, la que se define de la siguiente manera: e = L/k 4º Rango de trabajo (L1): Es el recorrido de la variable que va a tener la tabla de distribución de frecuencias, que se obtiene de la siguiente manera: L1 = e (k) 5 º Exceso: L1 debe ser igual o mayor que L, en caso de ser menor se agrega 1 a la amplitud de clase (e), con ello L1 es mayor que L. Exceso =

L1 – L

En la elaboración de la columna principal de la tabla, si el exceso es 0, L1 es igual a L, por lo tanto se respetan los datos mínimo y máximo, trabajando la tabla a partir de ellos. En caso de haber exceso, si este es par, se calcula el nuevo dato mínimo restándole la mitad del exceso y el nuevo dato máximo sumándole la mitad del exceso. Si el exceso es impar, se resta uno para volverlo par con el objeto de repetir el proceso de repartir el exceso por parte iguales, y el uno restado al impar se le suma al nuevo dato máximo. Ejercicios Resueltos: 1) En una encuesta dirigida 80 obreros de Construcción Civil, se encontró que el número de hermanos vivos que conocían era el siguiente: 5623108452 6969542958

1039563257 7741251036

4512036952 5258963587 z7 8 z

1002314586 4125163897


WA LT E R C É S P E D E S R A M Í R E Z

Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos obreros tienen 5 hermanos vivos? c) ¿Qué porcentaje de obreros tienen 8 hermanos vivos? d) ¿Qué porcentaje de obreros tiene más de 3 hermanos vivos? e) ¿Qué porcentaje de obreros tiene menos de 5 hermanos vivos? Solución: Como las variaciones de datos a distribuir son pequeñas, la tabla va a quedar organizada por la lista o por la relación de valores número de hermanos vivos. a) Tabla de distribución de frecuencias de variable discreta

b) ¿Cuántos obreros tienen 5 hermanos vivos? 14 obreros. c) ¿Qué porcentaje de obreros tienen 8 hermanos vivos? 7,5% d) ¿Qué porcentaje de obreros tiene más de 3 hermanos vivos? 58,75% e) ¿Qué porcentaje de obreros tiene menos de 5 hermanos vivos? 48,75% 2) Durante 60 días se observó el número de visitas diarias de la página Web de una pequeña empresa, que fueron las siguientes:

95 54 46 75 96 43 42 44 95 75 92 54 45 58 65

62 52 43 81 70 45 67 59 50 60 48 57 95 50 60

53 71 90 82 81 82 45 75 90 98 40 82 67 58 58

43 61 75 81 62 87 75 48 86 59 42 54 48 58 67

Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántas visitas fueron en número de 60 en promedio? c) ¿Qué porcentaje de visitas fueron en número de 69 en promedio? d) ¿Qué porcentaje de visitas fueron mayores de 55? e) ¿Qué porcentaje de visitas fueron menores de 83?

z7 9 z


E S TA D Í S T I C A I

Solución: Como las variaciones de las visitas a la página web es amplia, se hace necesario construir la tabla por intervalos, para ello hay que realizar los siguientes pasos. 1º Recorrido de la Variable (L): L

L = Dato máximo – Dato mínimo + 1 = 98 – 40 + 1 = 59

2º Número de Intervalos de clase (k):

k = 1 + 3,322 log N

k = 1 + 3,322 log 60 = 1 + 3,322(1,77815125) = 6,607 = 7 clases 3º Tamaño de clase (e):

e = L/k

e = 59 / 7 = 8,42857 = 9 (Si se redondea a 8, L1 es menor que L). 4º Rango de trabajo (L1):

L1 = e (k) L1 = 9 (7) = 63.

5 º Exceso = L1 – L = 63 – 59 = 4

por que

L1 > L

Nuevo Dato mínimo = 40 – (4 / 2) = 38 Nuevo Dato máximo = 98 + (4 / 2) = 100 En la construcción de la tabla, el límite inferior de cada clase se obtiene a partir del nuevo dato mínimo (38), y los siguientes resultarán de agregar sucesivamente la amplitud o tamaño de clase. El límite superior se obtiene de manera inversa, colocando en la última clase el nuevo dato máximo (100), luego se va restando sucesivamente el tamaño de clase, para ir obteniendo los otros límites superiores, estos límites se escriben al final de la clase a que corresponde. Número de visitas 38

.

47

.

56

.

65

73

74

82

.

91

.

100

Una vez concluida la columna principal, se continúa con el desarrollo de la tabla como cualquier tabla de distribución de frecuencias. Recuerde que en la tabulación se pasan los datos uno por uno, hasta el último.

z8 0 z


WA LT E R C É S P E D E S R A M Í R E Z

a) Tabla de distribución de frecuencias de variable discreta

b) ¿Cuántas visitas fueron en número de 60 en promedio? c) ¿Qué porcentaje de visitas fueron en número de 69 en promedio? d) ¿Qué porcentaje de visitas fueron mayores de 55? e) ¿Qué porcentaje de visitas fueron menores de 83?

12 visitas 10,00% 65,00% 83,33%

Observe que en la tabla hay una nueva columna Xi (Marca de clase), esta columna solo existe en las tablas con distribuciones de frecuencias por intervalos, que representa el promedio de la clase. 3) Una gran empresa con 5 plantas de producción, encontró el siguiente número de tardanzas durante 125 días de trabajo:

29 13 19 11 27

25 18 27 25 23

34 21 17 13 41

39 26 18 30 34

53 34 22 43 29

59 28 54 34 15

61 53 49 31 21

24 61 24 20 25

36 24 46 34 31

31 21 33 12 39

50 54 43 42 41 10 16 52 27 37 25 60 53 41 18 17 40 31 49 26 34 19 34 38 29

51 60 25 19 22 21 26 32 35 26 17 19 61 54 35 39 42 35 38 40 45 48 40 39 48

28 45 63 52 34 18 24 19 32 47 21 18 24 45 52 27 38 31 32 41 33 14 42 46 38

Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántas tardanzas fueron en número de 33 en promedio? c) ¿Qué porcentaje de tardanzas fueron en número de 47 en promedio? d) ¿Qué porcentaje de tardanzas fueron mayores de 29? e) ¿Qué porcentaje de tardanzas fueron menores de 23? Solución: Se debe construir la tabla por intervalos con los siguientes pasos: 1º Recorrido de la Variable (L): L = 63 – 10 + 1 = 54.

L = Dato máximo – Dato mínimo + 1

2º Número de Intervalos de clase (k): k = 1 + 3,322 log N. k = 1 + 3,322 log 125 = 1 + 3,322(2,09691) = 7,965935 = 8 clases. z8 1 z


E S TA D Í S T I C A I

3º Tamaño de clase (e): e = L/k e = 54 / 8 = 6,75 = 7 4º Rango de trabajo (L1): L1 = 7 (8) = 56.

L1 = e (k)

5 º Exceso = L1 – L = 56 – 54 = 2 por que Nuevo Dato mínimo = 10 – (2 / 2) = 9 Nuevo Dato máximo = 63 + (2 / 2) = 64

L1 > L

En la construcción de la tabla, el límite inferior de cada clase se obtiene a partir del nuevo dato mínimo (9), y los siguientes resultarán de agregar sucesivamente la amplitud o tamaño de clase. El límite superior se obtiene de manera inversa, colocando en la última clase el nuevo dato máximo (64), luego se va restando sucesivamente el tamaño de clase. Número de Tardanzas 9

.

16

.

23

.

.

.

.

50

.

57

.

64

Una vez concluida la columna principal, se continúa con el desarrollo de la tabla como cualquier tabla de distribución de frecuencias. Nuevamente recuerde que en la tabulación se pasan los datos uno por uno, hasta el último. a) Tabla de distribución de frecuencias de variable discreta.

b) ¿Cuántas tardanzas fueron en número de 33 en promedio? 23 tardanzas c) ¿Qué porcentaje de tardanzas fueron en número de 47 en promedio? 8,8% d) ¿Qué porcentaje de tardanzas fueron mayores de 29? 57,6% e) ¿Qué porcentaje de tardanzas fueron menores de 23? 23,2% z8 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Resolver los siguientes ejercicios propuestos, utilizando Distribución de Frecuencias de Variable Discreta: 1) A 80 promotores de la educación se le consultó sobre el número apropiado de alumnos por aula, para una enseñanza eficiente. Con los datos construya la tabla con 6 clases y determine la proporción de promotores que prefieren menos de 27 alumnos. 25 32 40 45 48

30 20 40 50 20

22 28 34 38 40

45 47 21 48 36

24 26 25 15 22

18 16 21 23 18 22 28 34 38 40 24 26 25 15 22.

16 45 48 36 45 18 20 36 34 20

18 20 36 34 20 24 26 25 15 22

24 22 34 18 22 26 45 40 18 30

30 36 20 16 25 25 28 33 25 28

Resp: 55% 2) Construir una tabla de distribución de frecuencias con el siguiente número de hijos encontrado en 120 hogares y determine ¿cuál es el número de hijos (Xi) se presenta con menor frecuencia? 2532404548 2426251522 2228343840

3020405020 2528332528 1820363420

2228343840 1816212318 2426251522

4547214836 1645483645 2645401830

Resp: 7 hijos 3) Durante 90 días se controló la asistencia de niños al museo de Lima, con los datos construir una tabla de distribución de frecuencias y determine ¿cuál fue el número promedio de asistencias de niños (Xi) resultó con la frecuencia más alta? 25 17 65 26

36 46 48 58

95 82 57 94

25 68 75 84

45 91 78 77

65 55 92 73

36 58 15 80

96 34 10 24

85 37 16 28

25 26 14 67

14 15 80 28

14 57 25 75

75 78 27 81

76 97 23 78

58 45 36 29 98 23 65 58 75 47 73 18 22 30 45 57 21 54 25 20 28 40 85 78 84 87 28 61 48 75 92 94 76 16

Resp: 80 niños 4) Con el número de accidente de tránsito en la ciudad de Lima, construir la tabla de distribución de frecuencias y determine ¿Cuál fue el número promedio de accidentes (Xi) que más veces se presentó? 15 25 45 25 12 05 12 34 15 11 16 08 11 04 27

13 31 44 41 32 08 19 24 28 39 19 24 31 08 10

26 02 25 18 17 12 16 37 29 14 37 17 25 22 20

16 40 30 20 10 15 11 06 07 14 41 38 29 16 11

15 16 12 17 05 21 06 18 27 19 16 27 22 40 37

Resp: 17 accidentes

z8 3 z


E S TA D Í S T I C A I

5) Con el número de clientes que compran diariamente en un minimarket, construir una tabla de distribución de frecuencias y determine, ¿qué número promedio de compras (Xi) resultó con la frecuencia más baja? 56 61 45 47

68 48 85 65

48 52 65 85

45 47 67 68

47 58 70 59

84 41 51 53

95 49 48 65

86 57 44 47

65 63 43 42

82 68 57 80

93 75 78 87

41 52 81 54

47 48 96 42

44 67 96 68

68 79 92 81

59 69 58 55

41 78 54 63

43 81 47 68

57 73 46 81

85 88 69 75

88 57 68 59

65 70 52 52

75 73 48 48

73 57 47 67

50 55 54 72

Resp: 93 compras

2.2.1.3. Distribución de Frecuencias de Variables Continuas Las variables continuas solo pueden organizarse en tablas de distribución de frecuencias por intervalos de clases, que debe contener 5 clases como mínimo y 12 como máximo. En la confección de la tabla de variable continua, se dan los mismos pasos, que en la confección de la tabla de variable discreta por clase, con la única diferencia que al recorrido de la variable (L) no se le suma 1: 1º Recorrido de la Variable (L):

L = Dato máximo – Dato mínimo.

2º Número de Intervalos de clase (k):

k = 1 + 3,322 log N.

3º Tamaño de clase (e):

e = L/k

4º Rango de trabajo (L1):

L1 = e (k)

5 º Exceso: (Si L1 < L, se agrega 1 “e”)

Exceso =

L1 – L

En la elaboración de la columna principal de la tabla, si el exceso es 0, L1 es igual a L, por lo tanto se respetan los datos mínimo y máximo, trabajando la tabla a partir de ellos. En caso de haber exceso, si este es par, se calcula el nuevo dato mínimo restándole la mitad del exceso y el nuevo dato máximo sumándole la mitad del exceso. Si el exceso es impar, se resta uno para volverlo par con el objeto de repetir el proceso de repartir el exceso por parte iguales, y el uno restado al impar se le suma al nuevo dato máximo. Construida la columna principal de la variable continua, a diferencia de la variable discreta, el límite superior (Ls) de una clase es el límite inferior (Li) de la clase siguiente, por ser datos continuos; al repetirse este valor en dos clases consecutivas, se crea un problema porque el dato con el mismo valor repetido no puede registrarse en ambas clases, teniéndose que elegir una de ellas. Si se registra dónde está el límite superior, se estará utilizando el criterio “hasta”, o “cerrado a la derecha”; en caso contrario, se estará utilizando el criterio “a partir de” o “cerrado a la izquierda”. En este texto se utilizará solo el criterio “a partir de”, [… >, porque al escogerse un criterio, todas las distribuciones de frecuencias, deben tener el mismo criterio; no se recomienda usar ambos criterios, para evitar crear confusión.

z8 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) Una empresa con 100 trabajadores, paga las siguientes remuneraciones en soles:

805 2061 2358 1548 987 857 1879 1245 2000 845 2061 986 1250 2489 3015 894 1259 1638 1846 1682 986 1056 3507 2067

1522 3015 2985 2015

3965 945 1045 1806 2708 2215 1200 2894 1245 956 1068 1249 2018 1039 1678 1534 1025 987 1156 2145 1368 2715 1044 1245 1369 2049 2684 1894

960 1648 3505 1023

1874 965 1258 3015 2745 1457 1896 2956 2024 978 997 1570 1840 1548 1362 1029 2715 1836 2495 1723 2044 1788 1156 2780 1587 2674 1578 1745 1692 1023 3054 3485 2691 3478 3410 1578 2069 3415 3484 1055

Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos ganan 1 792,50 soles en promedio? c) ¿Qué porcentaje ganan en promedio 3 372,50 soles? d) ¿Qué porcentaje ganan más de 2 780 soles? e) ¿Qué porcentaje ganan menos de 1 595 soles? f) ¿Qué porcentaje ganan entre 1 990 y 2 385 soles? Solución: Hay que realizar los siguientes pasos. 1º Recorrido de la Variable (L): L = 3 965 – 805 = 3 160.

L = Dato máximo – Dato mínimo

2º Número de Intervalos de clase (k): k = 1 + 3,322 log N. k = 1 + 3,322 log 100 = 1 + 3,322(2) = 7,644 = 8 clases. 3º Tamaño de clase (e): e = 3 160 / 8 = 395

e = L/k

4º Rango de trabajo (L1): L1 = 395 (8) = 3 160.

L1 = e (k)

5º Exceso = L1 – L = 3 160 – 3 160 = 0 Como no hay exceso (0), el dato mínimo y el dato máximo, permanecen iguales, no hay necesidad de corregirlos. En la construcción de la tabla, los límites inferiores de cada clase se obtienen a partir del dato mínimo (805), resultando los otros de agregar sucesivamente el tamaño de clase. Los límites superiores se obtienen de manera inversa, colocando al final de la última clase el nuevo dato máximo (3 965), resultando los otros de ir restando sucesivamente el mismo tamaño de clase. Los límites inferiores se escriben al principio y los superiores al final. z8 5 z


E S TA D Í S T I C A I

Remuneraciones 805

.

1 200

.

1 595

.

1 990

2 385

2 385

2 780

.

3 175

.

3 570

.

3 965

Una vez concluida la columna matriz o principal, se continúa con el desarrollo de la tabla como cualquier tabla de distribución de frecuencias. Recuerde que en la tabulación se pasan los datos uno por uno, hasta el último. a) Tabla de distribución de frecuencias de variable continua Remuneraciones

Tabulación

fi

hi

Fi

Hi

Fi

Hi

Xi

[ 805

1 200> lllll lllll lllll lllll lllll l

26

0,26

26

026,

100

1,00

1 002,5

[1 200

1 595> lllll lllll lllll lllll

20

0,20

46

0,46

74

0,74

1 397,5

[1 595

1 990> lllll lllll lllll l

16

0,16

62

0,62

54

0,54

1 792,5

[1 990

2 385>

13

0,13

75

0,75

38

0,38

2 187,5

[2 385

2 780> lllll llll

9

0,09

84

0,84

25

0,25

2 582,5

[2 780

3 175>

8

0,08

92

0,92

16

0,16

2 977,5

[3 175

3 570> lllll

5

0,05

98

0,98

8

0,08

3 372,5

[3 570

3 965>

3

0,03

100

1,00

3

0,03

3 767,5

100

1,00

Menos de

N

lllll lllll lll

lllll lll

lll

Más de

En la tabla como ya se ha indicado, los datos se registran “a partir de” o también [ … >, por ejemplo el dato 1 200 fue registrado en la segunda clase porque en ella van todos los datos a partir de 1 200 hasta 1 594,99……. b) ¿Cuántos ganan 1 792,50 soles en promedio? c) ¿Qué porcentaje ganan en promedio 3 372,50 soles? d) ¿Qué porcentaje ganan más de 2 780 soles? e) ¿Qué porcentaje ganan menos de 1 595 soles? f) ¿Qué porcentaje ganan entre 1 990 y 2 385 soles?

16 trabajadores 5,00% 16,00% 46,00% 13,00%

2) El registro de ingreso en horas y minutos de 120 trabajadores de una compañía es la siguiente: Por ejemplo: 7,35 significa 7horas y 35 minutos. z8 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos llegaron a las 7h 57’ 30” en promedio? c) ¿Qué porcentaje llegaron a las 7h 47’ 30” en promedio? d) Si la tardanza se controla a partir de las 8 horas, ¿Qué porcentaje llegaron tarde? e) ¿Qué porcentaje llegaron antes de las 7h 50’? Solución: 1º Recorrido de la Variable (L): L = Dato máximo – Dato mínimo Como las horas y minutos no se pueden operar juntos, los datos máximos y mínimos serán transformados en minutos para determinar el rango en minutos. Dato máximo = 8h 14’ = 8(60) + 14 = 494 minutos Dato mínimo = 7h 35’ = 7(60) + 35 = 455 minutos L = 494 – 455 = 39 minutos. 2º Número de Intervalos de clase (k): k = 1 + 3,322 log N. k = 1 + 3,322 log 120 = 1 + 3,322(2,07918) = 7,907 = 8 clases. 3º Tamaño de clase (e): e = L/k e = 39 / 8 = 4,875 = 5 minutos

4º Rango de trabajo (L1): L1 = 5 (8) = 40.

L1 = e (k)

5º Exceso = L1 – L = 40 – 39 = 1 Como el exceso es 1 solo, se corrige el dato máximo al que se le suma el exceso 1, el dato mínimo permanece igual. Se generan los límites a partir de las 7h.35’ y se van agregando de 5 en 5 minutos, que es el tamaño de cada clase, luego se pasan los 120 datos, uno por uno hasta completar la tabla. La suma de hi siempre es 1, en los casos que aún con el redondeo sea menor o mayor de 1, usted debe corregir el redondeo para que de la suma exactamente 1.

z8 7 z


E S TA D Í S T I C A I

a) Tabla de distribución de frecuencias de variable continua

b) ¿Cuántos llegaron a las 7h 57’ 30” en promedio? c) ¿Qué porcentaje llegó a las 7h 47’ 30” en promedio? d) Si la tardanza se controla a partir de las 8 horas, ¿Qué porcentaje llegó tarde? e) ¿Qué porcentaje llegó antes de las 7h 50’?

20 trabajadores 13,33% 30,00% 32,49%

Resolver los siguientes ejercicios propuestos, utilizando Distribución de Frecuencias de Variable Continua: 1) Construya la tabla de distribución de frecuencias y determine la edad promedio con mayor frecuencia, entre los siguientes trabajadores de una empresa: 28 26 37 22

19 28 22 38

Resp:

42 38 48 44

51 40 36 50

29 44 29 23

27 37 20 28

31 26 27 67

20 25 33 48

33 38 35 41

93 31 21 57

24 26 29 26

30 24 34 31

41 19 26 44

57 18 34 46

26 27 40 28

30 24 46 25

35 55 51 26

38 42 27 34

25 26 28 56

21 34 52 44

26 años

2) Construya la tabla de distribución de frecuencias con los pesos en kilogramos de 100 alumnos y determine el peso promedio con menor frecuencia:

58 62 55 44 46

53 68 39 47 71

64 53 58 41 46

57 53 60 47 40

39 60 45 48 52

64 43 50 62 48

44 48 56 47 51

55 45 47 68 52

71 66 52 44 58

56 46 44 68 56

48 57 44 42 61

52 64 54 47 39

54 62 50 48 40

57 41 43 52 64

45 47 48 50 55

47 42 48 43 58

55 45 42 61 70

45 52 57 44 40

47 39 56 60 48

51 45 48 60 57

Resp:

65 kilos

3) Construya la tabla de distribución de frecuencias con las tallas en centímetros de 120 escolares y determine ¿cuántos mide más de 161centímetros? z8 8 z


WA LT E R C É S P E D E S R A M Í R E Z

140 156 147 128 156 175 160 138

154 180 162 142 142 162 180 174

145 173 175 158 158 175 173 168

168 169 164 167 161 164 169 173

143 152 157 132 176 157 132 160

126 157 136 158 158 136 157 138

162 146 140 153 140 140 146 133

155 143 138 169 138 138 143 127

143 150 130 157 148 130 141 157

173 176 128 140 167 128 176 180

143 168 145 152 145 145 168 172

155 160 158 138 156 158 160 176

149 152 162 134 168 162 152 132

156 172 170 141 173 170 172 140

164 154 132 157 174 182 145 138

Resp: 42 escolares

4) Construya la tabla de distribución de frecuencias con los jornales (diarios) de 150 obreros y determine ¿Qué proporción de obreros ganan 53,50 soles en promedio?

36 28 45 47 24 38 85 38

48 47 28 36 35 55 45 45

Resp:

87 58 37 28 47 29 72 26

28 68 36 47 45 38 25 89

35 29 45 57 50 45 34 42

94 34 72 72 83 47 50 25

58 42 80 81 75 85 37 87

88 47 55 83 92 75 26 24

24 46 47 90 84 48 45 26

45 22 73 52 68 37 88 73

67 28 76 27 26 26 75

72 34 26 35 83 23 47

26 26 30 46 57 27 70

45 37 40 37 67 64 44

48 47 47 45 66 42 28

38 58 30 24 84 57 26

39 68 35 31 90 38 33

75 72 26 40 57 30 58

50 88 31 55 72 26 77

65 54 51 62 71 34 34

8,67%

2.2.2. Gráficos Los gráficos son útiles porque ponen en relieve y aclaran las tendencias que no se captan fácilmente en las tablas, ayudan a estimar valores con una simple ojeada y brinda una verificación gráfica de la veracidad de las soluciones. Los investigadores encuentran en los gráficos, una manera de captar con rapidez como están compuestos los datos en su conjunto, visualizando su estructura, conociendo su forma. Los tipos de gráficos utilizados por los investigadores son: el polígono de frecuencias y el histograma, porque le muestran la densidad de la información graficada. También utilizan las ojivas “más de” y “menos de”, para observar el comportamiento de las clases en grupos.

2.2.2.1. Polígono de Frecuencias Es un tipo de gráfico por el cual se unen los puntos formados por los pares ordenados (Xi, fi) de las marcas de clase con la frecuencia absoluta en forma consecutiva a partir z8 9 z


E S TA D Í S T I C A I

del punto (X0, 0) hasta el punto (Xn+1, 0), de tal manera que la línea continua o polígono encierra el 100% de la información, generando una función de densidad. También se puede obtener el polígono de frecuencias uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas. El polígono de frecuencias por ser de investigación, además de ser graficado en el primer cuadrante de los ejes cartesianos, utiliza doble ordenada: a la izquierda van los valores de la ordenada principal fi, y a la derecha se grafica la otra ordenada con los valores complementarios hi; de tal manera que se puedan comparar en el gráfico los valores absolutos, en forma nominal (fi) y en forma proporcional (hi%).

Gráfico del Polígono de frecuencias Con la siguiente tabla de variable continua, graficar el polígono de frecuencia. Ingreso

fi

hi 0,0833

Xi

7h,35’

7h,40’

10

7h,40’

7h,45’

13

0,1083

7h,42’,30”

7h,45’

7h,50’

16

0,1333

7h,47’,30”

7h,50’

7h,55’

25

0,2084

7h,52’,30”

7h,55’

8h,00’

20

0,1667

7h,57’,30”

8h,00’

8h,05’

15

0,1250

8h,02’,30”

8h,05’

8h,10’

12

0,1000

8h,07’,30”

8h,10’

8h,15’

9

0,0750

8h,12’,30”

z9 0 z

7h,37’,30”


WA LT E R C É S P E D E S R A M Í R E Z

2.2.2.2. Histogramas Es un tipo de gráfico formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamaño en términos generales, o de diferente tamaño en términos particulares. La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sean mayores que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del intervalo. En el histograma se representan los mismos valores absolutos que se representa el polígono de frecuencias, utiliza igualmente dos ordenadas y en la abscisa se grafican los límites de cada clase que al ser unidos por una línea horizontal a la altura de su respectiva frecuencia, en cada clase se encierra la cantidad de datos que contienen.

Gráfico del Histograma Con la siguiente tabla de variable continua, graficar el histograma. Ingreso

fi

Hi 0,0833

Xi

7h,35’

7h,40’

10

7h,40’

7h,45’

13

0,1083

7h,42’,30”

7h,45’

7h,50’

16

0,1333

7h,47’,30”

7h,50’

7h,55’

25

0,2084

7h,52’,30”

7h,55’

8h,00’

20

0,1667

7h,57’,30”

8h,00’

8h,05’

15

0,1250

8h,02’,30”

8h,05’

8h,10’

12

0,1000

8h,07’,30”

8h,10’

8h,15’

9

0,0750

8h,12’,30”

z9 1 z

7h,37’,30”


E S TA D Í S T I C A I

2.2.2.3. Ojiva Menos de Es un tipo de gráfico por el cual se unen los puntos formados por los pares ordenados a partir de (0, 0) hasta el último. Los pares ordenados representan el cruce del límite superior de cada clase (Ls) con la frecuencia acumulada (Fi) respectiva, que sirven para observar el comportamiento de los datos a medida que se van agregando clase por clase, a partir de la primera hasta la última. Este tipo de gráfico, se puede realizar también con dos ordenadas: la principal con Fi y la ordenada auxiliar con Hi%.

Gráfico de la Ojiva Menos de: Con la siguiente tabla de variable continua, graficar la ojiva menos de. Ingreso

Fi

Hi

7h,35’

7h,40’

10

0,0833

7h,40’

7h,45’

23

0,1916

7h,45’

7h,50’

39

0,3249

7h,50’

7h,55’

64

0,5333

7h,55’

8h,00’

84

0,7000

8h,00’

8h,05’

99

0,8250

8h,05’

8h,10’

111

0,9250

8h,10’

8h,15’

120

1,0000

z9 2 z


WA LT E R C É S P E D E S R A M Í R E Z

2.2.2.4. Ojiva Más de Es el gráfico inverso al de la ojiva menos de.

Gráfico de la Ojiva Más de: Con la siguiente tabla de variable continua, graficar la ojiva más de. Ingreso

Fi

Hi

7h,35’

7h,40’

120

1,0000

7h,40’

7h,45’

110

0,9167

7h,45’

7h,50’

97

0,8084

7h,50’

7h,55’

81

0,6751

7h,55’

8h,00’

56

0,4667

8h,00’

8h,05’

36

0,3000

8h,05’

8h,10’

21

0,1750

8h,10’

8h,15’

9

0,0750

7

z9 3 z


E S TA D Í S T I C A I

AUTOEVALUACIÓN Nº 2

1) ¿En un tabulado, qué representa el encabezamiento? A) Lo que se desea expresar en el cuadro B) La información contenida en las columnas C) Todo aquello que en el título se indique como según D) B y C son correctas E) Todas son correctas 2) ¿En qué tipo de gráfico se representan figuras con relación a los datos? A) Pictogramas

B) Lineal C) Circular

D) Por barras

E) En todos

3) ¿Cuál es la diferencia entre los gráficos por barras superpuestas nominales de los porcentuales? A) Los nominales siempre tienen diferentes tamaños y los porcentuales no B) Los nominales se expresan en el valor de origen y los porcentuales en tanto por ciento C) En los nominales importa la unidad de información y en los porcentuales no D) B y C son correctas E) Todas son correctas 4) Tres puntos en un tabulado ¿qué representa? A) No hay información B) La información que existe es mínima o muy pequeña C) La información es cero D) B y C son correctas E) Existe información pero no está disponible 5) En el tabulado, el cruce de filas con columnas donde van las cifras que se publican ¿cómo se llama? A) Encabezado

B) Matriz

C) Título

D) Cuerpo

E) pié

6) ¿Qué información se consigna en la tabulación de la tabla de distribución de frecuencias? A) Números E) Todas menos A

B) Frecuencias

C) Tarjas

D) Palitos

7) En la tabla de distribución de frecuencias, ¿qué es la marca de clase? A) Representa a todos los datos de su clase B) La semisuma de sus límites C) El valor central de una clase D) A, B, y C son correctas E) Solo A y C son correctas

z9 4 z


WA LT E R C É S P E D E S R A M Í R E Z

8) La tabla de distribución de frecuencias de variables Discretas, pueden ser organizadas por: A) Solo por lista

B) Solo por clase

C) Por lista o por clases

D) Por, según

E) Ninguna

9) En el eje de la abscisa del gráfico de un histograma, van: A) Las frecuencias absolutas C) Las marcas de clase E) Las frecuencias relativas

B) Las frecuencias acumuladas D) Los límites de clases

10) En la Estadística para investigar una gráfica lineal toma el nombre de: A) Polígono de frecuencias D) Gráfica lineal

B) Ojiva menos de E) Todas menos D

C) Ojiva más de

11) Si los datos: mínimo y máximo de una variable discreta son 65 y 188 alumnos. ¿Cuál será el tamaño de cada clase para 250 datos? A) 16

B) 10

C) 14

D) 12

E) 9

12) Si los datos: mínimo y máximo de una variable discreta son 65 y 188 alumnos. ¿Cuáles serán los límites de la primera clase para 250 datos? A) 64 y 78

B) 65 y 79

C) 65 y 77

D)

64 y 77

E) Ninguno

13) Determine los límites de la última clase de una tabla de distribución de frecuencias con 150 datos en donde el dato mínimo y el dato máximo son remuneraciones de 625 y 2705 soles respectivamente. A) 2445 y 2705

B) 2450 y 2700

C) 2425 y 2705

D) 2450 y 2705

E) Ninguno

14) Hallar la frecuencia relativa acumulada hasta la 5ta clase con la siguiente información: Clases fi

25 45 22

A) 0,8960

45 55 56

55 65

65 75

458

156

B) 0,9141

C) 0,9216

75 85 85

85 95

95 105

63

D) 0,9415

10 E) 0,8956

15) Hallar la frecuencia relativa acumulada después de la 3ra clase con la siguiente tabla: Clases fi

25 45 22

A) 0,9082

45 55 56 B) 0,8865

55 65

65 75

458

156

C) 0,3694 z9 5 z

75 85 85 D) 0,3753

85 95

95 105

63 E) 0,6306

10


E S TA D Í S T I C A I

Respuestas de control 1. B, 2. A, 3. D, 4. E, 5. D, 6. E, 7. D, 8. C, 9. D, 10. E, 11. C, 12. D, 13. A, 14. B, 15. E

GLOSARIO Ejes cartesianos.

Están representados por el cruce de dos líneas de las cuales una es horizontal o abscisa y otra vertical u ordenada. Cada ángulo recto de los ejes cartesianos se denomina cuadrante.

Fenómeno.

En estadística este término se utiliza como sinónimo de variable.

Llamadas.

Es: una letra, un número o un carácter, que se utilizan en los tabulados, para explicar el contenido de una: casilla, una columna, una fila o todo el cuadro, según sea necesario.

Pares ordenados.

Son valores de la abscisa que junto a los valores de la ordenada, permiten en los gráficos determinar la posición de los puntos que representan el cruce de cada valor de ambos ejes.

Relevante.

Es un valor que sobresale o que se distingue de los demás.

Tratamiento.

Consiste en trabajar con un grupo de datos, para utilizarlos como información o para utilizarlos como investigación.

Software.

Es un paquete o conjuntos de programas informáticos, que son desarrollados con diferentes fines incluyendo el estadístico.

EXPLORACIÓN ON LINE http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt12.html#seccion1 http://www.aulafacil.com/CursoEstadistica/Lecc-3-est.htm z9 6 z


t e r c e r a

UNIDAD Medidas de Posición o de Localización

Promedios: Media Aritmética, Media Geométrica, Media Armónica Otras medidas de posición central: Mediana, Moda Cuantiles: Cuartiles, Deciles, Percentiles


OBJETIVO (S) GENERAL Aprender que las medidas de Posición son medidas de resumen, que se caracterizan por tener una ubicación importante dentro de un conjunto de datos; algunas de ellas tienden hacia el centro y otros no tienen esa tendencia. Además para calcular estas medidas estadísticas se debe conocer cómo se encuentran los datos, ya que pueden estar agrupados en distribuciones de frecuencias, o también pueden no estar agrupados. Las medidas de Posición central, tienen uso significativo dentro de la investigación, porque todos los datos quedan representados por dicho valor central. También porque se interpreta fácilmente. Además del centro, otras veces uno se interesa por el valor que se localiza en determinada posición dentro de los datos ya ordenados; ello es posible con los cuantiles. Si los datos no se encuentran agrupados, con un simple ordenamiento se puede visualizar: el cuartil, decil o cualquier otro cuantil, sin embargo cuando los datos se encuentran agrupados, para visualizarlos, se requiere de un proceso interpolatorio. ESPECÍFICOS • Conocer mediante los promedios cuáles son sus aplicaciones dentro de las medidas de posición, además de saber utilizarlos de manera aritmética o de manera geométrica. • Saber cuál es el dato que se posiciona físicamente en el centro o es aquel que aparece con mayor frecuencia. • Determinar cómo se distribuyen los datos al repartirlos en: cuartos, décimas o en centésimas. Esto permite conocer donde se ubican aquellos valores de interés en la investigación. z9 8 z


L e c c i ó n

1

3.1. PROMEDIOS Se denominan promedios a los estadígrafos de posición que tienen una tendencia central, por que establecen el valor medio o simplemente la media del valor total de los datos o de una muestra. El Estadístico Yule ha definido algunas propiedades deseables para una medida estadística de resumen de esta naturaleza: 1º Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numérico. 2º Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observación la medida considerada debe reflejar esta variación. 3º Tener un significado concreto: la interpretación debe ser inmediata y sencilla. 4º Ser sencilla de calcular. 5º Prestarse fácilmente al cálculo algebraico: Lo que permitirá demostraciones más elegantes. 6º Ser poco sensible a las fluctuaciones muestréales. Esta condición es imprescindible en la Estadística Matemática y en la Teoría de Sondeos. Existen diferentes tipos de promedios, a continuación se definirán los promedios mayormente utilizados en la Estadística Descriptivas:

z9 9 z


E S TA D Í S T I C A I

3.1.1. Media Aritmética ( X ) La media es la medida de posición central más importante, porque se constituye como el valor central por excelencia. El promedio es la suma de todos los valores que toma una variable sobre el total de la muestra o de la población que presentan variación aritmética, es el incremento o disminución del valor de los datos u observaciones en forma pequeña, porque no obedece a ningún factor, sino a un valor agregado o a un valor que se sustrae. Lo más positivo de la media, es que se utilizan para su cálculo todos los valores, por lo que no se pierde una sola información. Sin embargo presenta el problema de que su valor se puede ver influido por valores extremos, que se aparten en exceso del resto de los valores. Estos valores extremos podrían condicionar el valor de la media, perdiendo representatividad de la muestra o de la población. En Estadística se acostumbra para diferenciar una media aritmética de una muestra, con la media aritmética de una población, simbolizando a la muestra como X , y a la población como μ. La media aritmética tiene dos propiedades importantes que son: 1º Si se multiplican o se dividen todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho número. 2º Si se le suman o se le restan a todas las observaciones un mismo número, la media aumentará o disminuida en dicha cantidad. Dependiendo de la disponibilidad de los datos, la media aritmética se define de tres maneras diferentes, que son:

3.1.1.1. Media Aritmética Simple Cuando se calcula el promedio tomando todos los datos como están; es decir sin ordenamiento y sin ser agrupados, se denomina media aritmética simple. Este tipo de media aritmética, también es conocida como media aritmética para datos no agrupados o simplemente media aritmética de datos desordenados. La media aritmética simple, se define de la siguiente manera:

Donde: Xi N

= =

Variable Número total de datos o número de observaciones

z1 0 0 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos: 1) Hallar la media aritmética utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:

2) Hallar la media aritmética utilizando los siguientes remuneraciones en soles: 1 412, 1 258, 1 528, 1 375, 1 248, 1 264, 1 347, 1 432. Solución:

3) Hallar el promedio de hijos de las siguientes familias: 4, 8, 1, 3, 5, 4, 4, 6, 0, 2 Solución:

A pesar de ser el número de hijos una variable discreta, se puede decir que las familias en promedio tienen 3,7 hijos, porque la media aritmética es una medida. Resolver los siguientes ejercicios propuestos, utilizando Media Aritmética Simple: 1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar el precio promedio por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10. Resp:

13,00

2) Hallar el promedio de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55. Resp:

67,00

3) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el promedio de remuneraciones? Resp:

29 014

4) Hallar la media aritmética de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322. Resp:

320 z1 0 1 z


E S TA D Í S T I C A I

5) Hallar el promedio de asistencia de: 118, 107, 115, 110 y 120. Resp:

114

6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la media aritmética. Resp: 1 656 7) Hallar la media aritmética de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 160, 187 y 162. Resp: 169,25 8) Hallar la media aritmética de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302. Resp: 306

3.1.1.2. Media Aritmética Ponderada Cuando a cada uno de los datos se le asigna un factor (W) llamado también peso o ponderación, dependiendo de la mayor o menor importancia que se desee otorgar; para obtener el promedio ponderado, primero se multiplica cada dato por su respectivo peso, luego se suman los productos para después dividirlos entre la suma de los factores o pesos. Este tipo de media aritmética, tiene mayor uso cuando se promedian evaluaciones, porque es muy común que algunos de los calificativos obtenidos tengan mayor valor que otros, dependiendo de los tipos de pruebas en las evaluaciones. La media aritmética ponderada, se define de la siguiente manera:

Donde: Xi = n = Wi =

Variable Número de observaciones o datos Ponderación o peso

z1 0 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones Wi

195

84

81

88

128

164

2

5

2

3

3

5

Solución Calificaciones (Xi) Wi Xi Wi

195

84

81

88

128

164

Total

2

5

2

3

3

5

20

390

420

162

264

384

820

2440

2) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones Wi

15

8

9

12

18

16

1

2

3

3

4

2

Solución Calificaciones (Xi) Wi Xi Wi

15

8

9

12

18

16

Total

1

2

3

3

4

2

15

15

16

27

36

72

32

198

X = 198 / 15 = 13,2 puntos

3) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones Wi

125

181

124

118

124

150

8

8

8

8

8

8

Solución: Calificaciones (Xi) Wi Xi Wi

125

181

124

118

124

150

Total

8

8

8

8

8

8

48

1 000

1 448

992

944

992

1 200

6 576

X = 6 576 / 48 = 137 puntos

z1 0 3 z


E S TA D Í S T I C A I

Cuando las ponderaciones de todos los datos son iguales, no tiene sentido calcular la media aritmética en forma ponderada, porque este tipo de promedio solo se utiliza cuando hay diferencia entre los datos; con una media aritmética simple, el resultado es el mismo.

Resolver los siguientes ejercicios propuestos, utilizando media aritmética ponderada: 1) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones

125

181

124

118

124

150

Wi 4 8 5 9 2 7 Resp: 140,80 2) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones

12

18

5

17

14

15

Wi 1 2 3 4 5 6 Resp: 13,95 3) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones

134

156

182

145

147

165

Wi 4 3 4 4 3 4 Resp: 155,14 4) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones

1 322

1 184

1 244

1 186

1 434

1 350

Wi 2 2 3 3 4 4 Resp: 1 302,11 5) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones

12,8

11,5

14,6

11,8

14,7

16,0

Wi 5 10 5 10 8 12 Resp: 13,59

z1 0 4 z


WA LT E R C É S P E D E S R A M Í R E Z

3.1.1.3. Media Aritmética para Datos Agrupados Cuando los datos han sido agrupados en tablas de distribución de frecuencias, para calcular la media aritmética es necesario identificar dentro de cada grupo de datos o clases, que valor representa a cada clase que es la marca de clase (Xi). Una vez obtenido el valor representativo, se multiplica cada marca de clase por su respectiva frecuencia absoluta (fi), luego se suman los productos para después dividirlos entre la suma de las frecuencia (N). Algunos autores consideran que por multiplicar la marca de clase (Xi) por la frecuencia respectiva (fi), este tipo de media aritmética es ponderada, porque ven a la frecuencia absoluta como un factor que genera un valor distinto en cada marca de clase; sin embargo en este texto, se diferenciará claramente al factor como ponderación o importancia, del factor como frecuencia absoluta que representa las veces que se repite el valor. La media aritmética para datos agrupados, se define de la siguiente manera:

Donde: fi Xi n N

= = = =

Frecuencia absoluta Variable o marca de clase Número de marcas de clase o veces que cambia el valor de la variable Suma de las frecuencias absolutas o total de datos u observaciones.

Ejercicios resueltos 1) Hallar la media aritmética utilizando los siguientes datos agrupados: Nº de Asistentes

fi

26

34

3

35

43

15

44

52

26

53

61

38

62

70

40

71

79

30

80

88

12

89

97

6

z1 0 5 z


E S TA D Í S T I C A I

Solución: Nº de Asistentes

fi

Xi

26

34

3

30

fi Xi 90

35

43

15

39

585

44

52

26

48

1 248

53

61

38

57

2 166

62

70

40

66

2 640

71

79

30

75

2 250

80

88

12

84

1 008

89

97

6

93

558

170

Σ

10 545

2) Hallar la media aritmética utilizando las siguientes calificaciones: Calificaciones

fi

260

280

3

280

300

15

300

320

30

320

340

25

340

360

12

360

380

8

380

400

7

Solución: Calificaciones

fi

Xi

fi Xi

260

280

3

270

810

280

300

15

290

4 350

300

320

30

310

9 300

320

340

25

330

8 250

340

360

12

350

4 200

360

380

8

370

2 960

380

400

7

390

Σ

100

z1 0 6 z

2 730 32 600


WA LT E R C É S P E D E S R A M Í R E Z

Resolver los siguientes ejercicios propuestos, utilizando media aritmética para datos agrupados: 1) Hallar la media aritmética utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 15 18 26 36 20 10 Resp: 154,64

2) Hallar la media aritmética utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

11

25

40

65

37

14

8

fi

Resp: 88,30 3) Hallar la media aritmética utilizando los siguientes datos agrupados: Sueldos fi

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

14

30

48

54

34

20

Resp: 1 424,00 4) Hallar la media aritmética utilizando los siguientes datos agrupados: Pedidos fi

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

4

16

25

18

12

5

Resp: 3 912,50 5) Hallar la media aritmética utilizando los siguientes datos agrupados: Pesos (Kg) fi

40 50

50 60

60 70

70 80

80 90

90 100

100 110

5

25

55

45

38

22

10

Resp: 74,60

z1 0 7 z


E S TA D Í S T I C A I

6) Hallar la media aritmética utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 14 26 35 28 17 5 Resp: 4 184,00

3.1.2. Media Geométrica La media geométrica es la medida de posición central de utilidad cuando los datos presentan variación geométrica; es decir, cuando la variación es producto de un factor. Este tipo de promedio es tan útil como la media aritmética aplicada a datos con variación aritmética. En Estadística existe poca información con datos que presentan variación geométrica, por esta razón a pesar de ser un promedio, no es utilizado con la misma intensidad que la media aritmética. La media geométrica conserva de la media aritmética, la propiedad de que si se multiplican o se dividen todas las observaciones por un mismo número, la media geométrica queda multiplicada o dividida por dicho número. Dependiendo de la disponibilidad de los datos u observaciones, esta medida de resumen se define de dos maneras diferentes, que son:

3.1.2.1. Media Geométrica Simple Este tipo de promedio conocido como media geométrica para datos no agrupados, se obtiene mediante la raíz enésima del producto de enésimos términos; también puede ser obtenido mediante el uso de logaritmos. La media geométrica para datos no agrupados o media geométrica simple, se define de la siguiente manera:

Donde: Xi = N =

Variable Número total de datos u observaciones.

Utilizando logaritmos, la media geométrica se define de la siguiente manera:

z1 0 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Donde: Log Xi =

N =

Logaritmo de la variable Número total de datos.

Con esta segunda fórmula de la media geométrica, los resultados se obtienen en logaritmos, por ello es necesario que al resultado que se obtenga de ella, se calcule el anti logaritmo para volver la información en su unidad de medida. El lector puede escoger cualquiera de las dos fórmulas para hallar la media geométrica, sin embargo cuando se trata de datos no agrupados, es más fácil utilizar la primera fórmula sin logaritmos, porque cualquier calculadora maneja estas cifras con facilidad. Ejercicios resueltos 1) Hallar la media geométrica utilizando los siguientes datos no agrupados: 28, 1 245, 56, 157 y 783. Solución:

Otra solución utilizando logaritmos: Log Xg = (log. 28 + log. 1245 + log. 56 + log. 157 + log. 783) / 5 Log Xg = (1,447158 + 3,095169 + 1,748188 + 2,1959 + 2,893762) / 5 Log Xg = 11,380177 / 5 = 2,2760354 Antilogaritmo de 2,2760354 = 188,81 Xg = 188,81

2) Hallar la media geométrica utilizando los siguientes datos no agrupados: 1 218, 245, 556, 1 507 63 y 87. Solución:

3) Hallar la media geométrica con los siguientes datos no agrupados: 4, 20, 100, 500 y 2 500. Solución:

Observe que si el dato siguiente es multiplicado exactamente por el mismo factor (5), y esto se repite continuamente, tendremos una progresión geométrica donde el promedio es exactamente el valor del centro. Esto mismo ocurre con la media aritmética, con la diferencia de que la variación no es un factor sino un mismo sumando.

z1 0 9 z


E S TA D Í S T I C A I

4) Hallar la media geométrica utilizando los siguientes datos no agrupados: 1, 7, 49, 343, 2 401, 16 807 y 117 649. Solución:

Cuando se trata de una misma progresión geométrica, el promedio geométrico es el valor del centro, sin importar que los datos estén ordenados o no.

Resolver los siguientes ejercicios propuestos, utilizando Media Geométrica Simple: 1) Hallar el promedio geométrico de una cuenta de ahorro a interés compuesto que durante 6 meses tuvo la siguiente variación: 1 224,20; 1 297,44; 1 382,80; 1 419,00; 1 527,90 y 1 673,50. Resp: 1 413,30 2) Hallar la media geométrica de: 1 245, 789, 521, 365, 1 045, 89, 76 y 1 758. Resp: 468,51 3) Hallar el promedio geométrico anual de crecimiento de una población rural durante 10 años que tuvo la siguiente variación: 673, 682, 701, 725, 748, 771, 792, 808, 818 y 836. Resp: 753,34 4) Hallar la media geométrica de: 2 245, 1 789, 1 521, 1 365, 2 045, 1 089, 1 076 y 1 758. Resp: 1 560,29 5) Hallar el promedio geométrico de una cuenta de ahorro a interés compuesto que durante 10 meses tuvo la siguiente variación: 528,56; 531,28; 540,19; 549,87; 556,25; 359,25; 367,15; 372,87; 380,02 y 388,15. Resp: 449,48 6) Hallar la media geométrica de: 45, 78, 52, 36, 81, 40, 89, 76 y 158. Resp: 65,68

z1 1 0 z


WA LT E R C É S P E D E S R A M Í R E Z

7) Hallar el promedio geométrico anual de crecimiento de la población de Lima durante 5 años que tuvo la siguiente variación: 12 458 358, 12 845 125, 13 345 320, 13 879 208 y 14 527 245. Resp:

13 391 068

8) Hallar el promedio geométrico anual de crecimiento de la población de vicuñas de Ayacucho durante 6 años que tuvo la siguiente variación: 25 458, 26 730, 28 334, 29 184, 30 458 y 31 587. Resp:

28 548,35

3.1.2.2. Media Geométrica para Datos Agrupados Este tipo de promedio se obtiene mediante la raíz enésima del producto de enésimos términos elevados a su correspondiente frecuencia absoluta; también puede ser obtenido mediante el uso de logaritmos. La media geométrica para datos agrupados, se define de la siguiente manera:

Donde: fi = Xi = n = N = Utilizando

Frecuencia absoluta Variable o marca de clase Número de marcas de clase o veces que cambia el valor de la variable Suma de las frecuencias absolutas o total de datos u observaciones logaritmos, la media geométrica se define de la siguiente manera:

Donde: Log Xi = fi = N = n =

Logaritmo de la variable Frecuencia absoluta Número total de datos u observaciones. Número de marcas de clase

Con esta segunda fórmula de la media geométrica, los resultados se obtienen en logaritmos, por ello es necesario que al resultado que se obtenga de ella, se calcule el anti logaritmo para volver la información en su unidad de medida.

z1 1 1 z


E S TA D Í S T I C A I

El lector puede escoger cualquiera de las dos fórmulas para hallar la media geométrica, sin embargo cuando se trata de datos agrupados, es más fácil utilizar la segunda fórmula, con logaritmos, porque al elevar la marca de clase (Xi) a la potencia que es la frecuencia absoluta (fi) puede generar un número excesivamente grande que cualquier calculadora no puede manejar; en cambio con los logaritmos, la operación se hace manejable. Ejercicios resueltos 1) Hallar la media geométrica utilizando los siguientes datos agrupados: Nacimientos

fi

126

134

3

135

143

15

144

152

26

153

161

38

162

170

40

171

179

30

180

188

12

189

197

6

Solución:

Nacimientos

fi

Xi

fi log. Xi

126

134

3

130

6,34183

135

143

15

139

32,14522

144

152

26

148

56,42680

153

161

38

157

83,44419

162

170

40

166

88,80432

171

179

30

175

67,29114

180

188

12

184

27,17781

189

197

6

193

Σ

170

Log Xg = 375,34465 / 170 = 2,20791 Xg = 161,40

z1 1 2 z

13,71334 375,34465

Anti logaritmos de: 2,20791 = 161,40


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar la media geométrica utilizando los siguientes datos agrupados: Depósitos en Ahorros

fi

1 260

2 280

4

2 280

3 300

15

3 300

4 320

20

4 320

5 340

25

5 340

6 360

12

6 360

7 380

8

7 380

8 400

6

Solución:

Depósitos en Ahorros

fi

Xi

fi log. Xi

1 260

2 280

4

1 770

12,99189

2 280

3 300

15

2 790

51,68406

3 300

4 320

30

3 810

107,42775

4 320

5 340

25

4 830

92,09868

5 340

6 360

12

5 850

45,20587

6 360

7 380

8

6 870

30,69565

7 380

8 400

6

7 890

23,38246

100

Σ Log Xg = 363,48636 / 100 = 3,6348636

363,48636

Anti logaritmos de: 3,6348636 = 4 313,84

Xg = 4 313,84

3) Hallar la media geométrica utilizando los siguientes datos agrupados: Ahorros fi

455 465 35

465 475

475 485

485 495

495 505

505 515

515 525

40

30

18

12

10

5

z1 1 3 z


E S TA D Í S T I C A I

Solución: Ahorros

fi

Xi

fi log. Xi

455

465

35

460

93,19652

465

475

40

470

106,88391

475

485

30

480

80,43724

485

495

18

490

48,42353

495

505

12

500

32,38764

505

515

10

510

27,07570

515

525

5

520

Σ (Total)

150

13,58002 401,98456

Log Xg = 401,98456 / 150 = 2,679897

Anti logaritmos de: 2,679897 = 478,52

Xg = 478,52

Resolver los siguientes ejercicios propuestos, utilizando Media Geométrica para Datos Agrupados:

1) Hallar la media geométrica utilizando los siguientes datos agrupados: Nacimientos

125 135

135 145

145 155

155 165

165 175

175 185

fi 15 18 26 36 20 10 Resp: 153,97

2) Hallar la media geométrica utilizando los siguientes datos agrupados: Ahorros

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 11 25 40 65 37 14 8 Resp: 87,15

3) Hallar la media geométrica utilizando los siguientes datos agrupados: Depósitos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 14 30 48 54 34 20 Resp: 1 396,20 z1 1 4 z


WA LT E R C É S P E D E S R A M Í R E Z

4) Hallar la media geométrica utilizando los siguientes datos agrupados: Préstam.

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 4 16 25 18 12 5 Resp: 3 691,88

5) Hallar la media geométrica utilizando los siguientes datos agrupados: Tasas (%)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 5 25 55 45 38 22 10 Resp: 73,20 6) Hallar la media geométrica utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 14 26 35 28 17 5 Resp: 3 960,36

3.1.3. Media Armónica ( Xh ) La media armónica es un promedio aritmético que se usa exclusivamente para hallar promedios de velocidad, ya sea: de vehículos, de máquinas o de hombres. El uso de esta medida estadística es restringido, porque tiene un solo objetivo. Cuando la variable es un valor compuesto, dada ya sea en velocidad por recorrido o en velocidad por producción, y los recorridos o producciones son los mismos o son variables, la Estadística tiene un procedimiento para hallar los promedios aritméticos a través de la media armónica. La media armónica es una medida de resumen, que se define de dos maneras, dependiendo de la información que se tiene:

z1 1 5 z


E S TA D Í S T I C A I

3.1.3.1. Media Armónica Simple La media armónica simple se utiliza cuando todas las variables compuestas de velocidad por la unidad de tiempo (Xi), tienen la misma importancia, o no tienen ponderación. Cuando a todas las velocidades a analizar, les corresponden una misma distancia o les corresponden una misma cantidad de producción, la media armónica simple se define de la siguiente manera:

Donde: Xi =

Variable de velocidad por la unidad de tiempo

Número total de datos.

N

=

Ejercicios resueltos 1) Hallar la media armónica o promedio de velocidad de un ciclista que recorre tres veces 100 kilómetros a: 60, 70 y 90 km. por hora. Solución:

2) Hallar la media armónica o promedio de velocidad de operación de 5 operarias que realizan la misma producción a: 25, 28, 32, 30 y 20 artículos por día. Solución:

3) Hallar el promedio de velocidad de operación de una operadora de teléfonos que durante 5 días en su jornada de trabajo que atendió la misma cantidad de llamadas, las realizó a: 480, 450, 460, 470 y 490 llamadas por día.

z1 1 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Solución:

Resolver los siguientes ejercicios propuestos, utilizando Media Armónica Simple: 1) Hallar la media armónica o promedios de velocidad de la siguiente producción por hora: 28, 24, 22, 26 y 28. Resp: 25,38 2) Hallar la media armónica o promedios de velocidad de los siguientes km. por hora: 35, 40, 55 y 40. Resp: 41,34 3) Hallar la media armónica o promedios de velocidad de la siguiente producción por día: 298, 284, 282, 265 y 288. Resp: 282,99 4) Hallar la media armónica o promedios de velocidad de la siguiente producción por turno: 18, 14, 16, 18, 18 y 20. Resp: 17,11 5) Hallar la media armónica o promedios de velocidad de los siguientes km. por hora: 150, 125, 120 y 100. Resp: 121,21 6) Hallar la media armónica o promedios de velocidad de la siguiente producción por hora: 8, 9, 7, 10, 8 y 8. Resp: 8,23 7) Hallar la media armónica o promedios de velocidad de la siguiente producción por día: 50, 54, 52, 56 y 46. Resp: 51,36 8) Hallar la media armónica o promedios de velocidad de la siguiente producción por turno: 165, 174, 158, 160 y 158. Resp: 162,78 9) Hallar la media armónica o promedios de velocidad de la siguiente producción por semana: 2 820, 2 814, 2 822, 2 826 y 2 810. Resp: 2 818,39

z1 1 7 z


E S TA D Í S T I C A I

3.1.3.2. Media Armónica para Datos Agrupados La media armónica para datos agrupados, se utiliza cuando las variables compuestas de velocidad por la unidad de tiempo (Xi), tienen diferente importancia o ponderación. Cuando todas las velocidades corresponden a distancias o a cantidades de producción diferentes, o al menos una de ellas, la media armónica para datos agrupados se define de la siguiente manera:

Donde: Xi = Variable de velocidad por la unidad de tiempo fi = Distancia recorrida o producción realizada N = Número total de datos. n = Número de veces que cambia el valor de la variable Ejercicios resueltos 1) Hallar la media armónica o promedio de velocidad de un ciclista que recorre: 100 kilómetros a 60 km. por hora, 150 km. a 70 km. por hora y 90 km. a 90 km. por hora. Solución:

2) Hallar la media armónica o promedio de velocidad de operación de 5 operarias que producen: 450 artículos a 25 artículos por día, 340 artículos a 28 artículos por día, 500 artículos a 32 artículos por día, 420 artículos 30 artículos por día y 360 artículos a 20 artículos por día. Solución:

3) Hallar el promedio de velocidad de operación de una operadora de teléfonos, que durante 5 días, en su jornada de trabajo, en las mañanas atendió: 220 llamadas a 480

z1 1 8 z


WA LT E R C É S P E D E S R A M Í R E Z

llamadas por día, 250 llamadas a 450 llamadas por día, 240 llamadas a 460 llamadas por día, 220 llamadas a 470 llamadas por día y 220 llamadas a 490 llamadas por día. Solución:

4) Hallar la media armónica de la siguiente distribución de frecuencias referida a las unidades producidas por días: Unidades

fi

455

465

30

465

475

40

475

485

30

485

495

18

495

505

12

505

515

10

515

525

5

525

535

5

Solución:

Unidades

fi

Xi

fi / Xi

455

465

30

460

0,065217

465

475

40

470

0,085106

475

485

30

480

0,062500

485

495

18

490

0,036735

495

505

12

500

0,024000

505

515

10

510

0,019608

515

525

5

520

0,009615

525

535

5

530

0,009434

Σ

150

150 / 0,312215 = 480,44 unidades / día

z1 1 9 z

0,312215


E S TA D Í S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Media Armónica para Datos Agrupados: 1) Hallar la media armónica utilizando los siguientes datos agrupados: Unidades

225 235

235 245

245 255

255 265

265 275

275 285

fi 15 18 26 36 20 10 Resp: 253,82 2) Hallar la media armónica utilizando los siguientes datos agrupados: Kilómetros

155 165

165 175

175 185

185 195

195 205

205 215

215 225

fi 11 25 40 65 37 14 8 Resp: 187,24 3) Hallar la media armónica utilizando los siguientes datos agrupados: Unidades

800 820

820 840

840 860

860 880

880 900

900 920

fi 14 30 48 54 34 20 Resp: 861,52 4) Hallar la media armónica utilizando los siguientes datos agrupados: Pedidos

100 120

120 140

140 160

160 180

180 200

200 220

fi 4 16 25 18 12 5 Resp: 154,16 5) Hallar la media armónica utilizando los siguientes datos agrupados: Kilogramos

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 5 25 55 45 38 22 10 Resp: 71,80 6) Hallar la media armónica utilizando los siguientes datos agrupados: Compras

150 250

250 350

350 450

450 550

550 650

650 750

fi 14 26 35 28 17 5 Resp: 372,42 z1 2 0 z


L e c c i ó n

2

3.2. OTRAS MEDIDAS DE POSICIÓN CENTRAL Entre los estadígrafos de posición, además de los promedios que tienden hacia el centro de todos los datos, existen otras medidas de resumen con las mismas tendencias, que son: la mediana y la moda. Mientras que la mediana se posiciona en el centro de los datos, la moda representa al o los datos de mayor frecuencia que en la práctica son datos centrales o tiene esa tendencia. La Estadística utiliza estas medidas, para resolver algunas dificultades que los promedios pueden ocasionar, sobre todo cuando la influencia de valores extremos es muy fuerte, generando distorsión en la media aritmética.

3.2.1. Mediana (Me) En el ámbito de la Estadística, la mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición, el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra o de la población. La mediana es una medida de localización o posición central y es igual a algunos cuantiles, porque coincide con ellos, tales como: el percentil 50, el cuartil 2 y el decil 5, entre los cuantiles más importantes. La mediana es considerada estadísticamente como una medida no matemática, porque una vez que los datos han sido ordenados, se puede observar que el valor o dato que se ubica en el centro es la mediana, y si hay dos valores en el centro, la mediana es el promedio de ambos, porque la mediana es única dentro de un conjunto de datos. z1 2 1 z


E S TA D Í S T I C A I

Esta medida recobra importancia, cuando dentro de un conjunto de datos, existen valores muy extremos que hacen que la media aritmética pierda credibilidad, porque como el promedio es una medida de tendencia central, se aleja de esa posición siendo atraído hacia el lado del valor extremo.

3.2.1.1. Mediana para Datos no Agrupados Para ubicar el valor de la mediana, considerando los datos u observaciones en forma individual, sin ser agrupados, primero se ordenan los datos en forma creciente o decreciente, luego se suma uno al total de datos para dividirlo entre dos, determinando que dato u observación tiene la posición central, y el dato que quede en esa posición es la mediana. Cuando la cantidad de datos es impar, (N + 1) / 2, la mediana es exactamente el dato del centro; en cambio, cuando la cantidad de datos es par, (N + 1) / 2, es un valor intermedio entre dos valores centrales; es este caso, la mediana es el promedio de los dos valores del centro, por que como ya se ha mencionado, todo conjunto de datos: muestra o población, solo tienen una mediana y una media aritmética. Cuando los datos son individuales o no han sido agrupados, para hallar el valor mediana, solo basta saber cuál es su posición, además como la mediana no es un promedio, no importa si los datos tienen variación aritmética o variación geométrica, por lo tanto no necesita de una fórmula para ser hallada.

Ejercicios resueltos 1) Hallar la mediana de: 158, 264, 78, 99, 157, 216 y 88. Solución: Ordenando los datos en forma creciente donde N = 7: Posición Dato

1

2

3

4

5

6

7

78

88

99

157

158

216

264

Ubicación de la mediana = (N + 1) / 2 = (7 + 1) / 2 = 4 Me = es el dato de la posición 4 = 157

z1 2 2 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar la mediana de:

1 508, 2 642, 978, 919, 1 058, 821, 625 y 1 000.

Solución: Ordenando los datos en forma creciente donde N = 8: Posición Dato

1

2

3

4

5

6

7

8

625

821

919

978

1 000

1 058

1 508

2 642

Ubicación de la mediana = (N + 1) / 2 = (8 + 1) / 2 = 4,5 El dato de la posición 4,5, es el promedio entre el dato 4 y el dato 5 Me = (978 + 1 000) / 2 = 989 3) Hallar la mediana de:

508, 647, 982, 969, 105, 828, 647, 325, 455 y 780.

Solución: Ordenando los datos en forma creciente donde N = 10: Posición Dato

1

2

3

4

5

6

7

8

9

10

105

325

455

508

647

647

780

828

969

982

Ubicación de la mediana = (N + 1) / 2 = (10 + 1) / 2 = 5,5 El dato de la posición 5,5, es el promedio entre el dato 5 y el dato 6 Me = (647 + 647) / 2 = 647 En los casos de que los dos valores del centro sean iguales, ya no es necesario hallar el promedio entre ambos, por solo basta con tomar uno de ellos.

Resolver los siguientes ejercicios propuestos, utilizando Mediana para Datos no Agrupados: 1) Hallar la mediana de: 45, 58, 45, 22 y 36.

Resp:

45

2) Hallar la mediana de: 156, 158, 98, 44, 365 y 452.

Resp:

157

3) Hallar la mediana de: 17, 56, 12, 65, 37,82 y 44.

Resp:

44

Resp:

45

Resp:

415

4) Hallar la mediana de: 148, 30, 66, 45, 58, 45, 22 y 36. 5) Hallar la mediana de: 415, 518, 475, 282 y 326.

z1 2 3 z


E S TA D Í S T I C A I

6) Hallar la mediana de: 3 456, 1 231, 4 567, 5 345 y 2 457

Resp:

3 456

7) Hallar la mediana de: 15, 9, 25, 8, 7, 11, 17, 4, 5, 5, 8 y 6

Resp:

8

8) Hallar la mediana de: 14, 15, 19, 12, 14, 19, 15, 18 y 14

Resp:

15

9) Hallar la mediana de: 34 567 y 22 161

Resp:

10) Hallar la mediana de: 196, 458, 785, 518, 789, 215 y 775

Resp:

28 364 518

3.2.1.2. Mediana para Datos Agrupados Para ubicar el valor de la mediana entre los datos agrupados en distribuciones de frecuencias, se divide el total de datos entre dos para encontrar la posición central que es donde se encuentra el valor de la mediana, en los casos de datos agrupados, no es necesario ordenar la información u observaciones, porque ya lo están. Cuando los datos han sido agrupados, para hallar el valor mediana, no solo basta saber cuál es su posición, sino que además como la mediana se encuentra dentro de una clase o grupo de datos, para hallarla es necesario utilizar un proceso de interpolación, sin importar si los datos tienen variación aritmética o variación geométrica, la fórmula para la interpolación se define de la siguiente manera: ESQUEMA DE INTERPOLACIÓN DE LA MEDIANA

z1 2 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Donde:

Li

=

Límite inferior de la clase donde está la mediana

Ls

=

Límite superior de la clase donde está la mediana

N

=

Número total de datos

fi

=

Frecuencia absoluta de la clase donde está la mediana

Fi – 1 e

= Frecuencia acumulada de la clase anterior a la posición de la mediana.

=

Amplitud o tamaño de la clase donde está la mediana (e = Ls – Li)

Ejercicios resueltos 1) Hallar la mediana utilizando los siguientes datos agrupados: Rem.

600 1000

1000 1400

1400 1800

1800 2200

21

58

65

28

fi

2200 2600 2600 3000 16

Solución: Remuneraciones

fi

Fi

600

1 000

21

21

1 000

1 400

58

79

1 400

1 800

65

144

1 800

2 200

28

172

2 200

2 600

16

188

2 600

3 000

12

200

Σ

200

Posición de la mediana: N / 2 = 200 / 2 = 100

z1 2 5 z

(Tercera clase)

12


E S TA D Í S T I C A I

2) Hallar la mediana utilizando los siguientes datos agrupados: Ventas (en millones)

2

fi

6

6 10

10 14

14 18

18 22

22 26

22

62

40

36

24

16

Solución: Ventas fi

en millones

Fi

2

6

16

16

6

10

22

38

10

14

62

100

14

18

40

140

18

22

36

176

22

26

24

200

Σ

200

Posición de la mediana: N / 2 = 200 / 2 = 100

(Tercera clase)

3) Hallar la mediana utilizando los siguientes datos agrupados: Alumnos fi

20 40

40 60

60 80

80 100

100 120

120 140

140 160

160 180

4

16

36

40

26

19

5

4

Solución: Alumnos

fi

Fi

20

40

4

4

40

60

16

20

60

80

36

56

80

100

40

96

100

120

26

122

120

140

19

141

140

160

5

146

160

180

4

150

Σ

150

z1 2 6 z


WA LT E R C É S P E D E S R A M � R E Z

PosiciĂłn de la mediana: N / 2 = 150 / 2 = 75

(Cuarta clase)

Resolver los siguientes ejercicios propuestos, utilizando Mediana para Datos Agrupados:

1) Hallar la mediana utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 157,36

2) Hallar la mediana utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 89,15

3) Hallar la mediana utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 30 48 54 34 14 Resp: 1 407,41

4) Hallar la mediana utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 16 25 18 10 5 Resp: 3 720

z1 2 7 z


E S TA D Í S T I C A I

5) Hallar la mediana utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 45 38 22 5 Resp: 72,22 6) Hallar la mediana utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 10 26 35 28 17 9 Resp: 4 257,14

3.2.2. Moda (Mo) La moda es aquel valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, porque es la única medida estadística que se aplica a variable cualitativa, además no precisa la realización de ningún cálculo. El valor de moda en distribuciones discretas o cualitativas, no requiere de una explicación mayor; sin embargo, cuando se trata de distribuciones continuas, se precisa de todo un proceso interpolatorio. Como medida de resumen, la moda es también la única que puede o no existir dentro de un conjunto de datos, y si existe, pueden observarse uno o más valores de moda, ya que como representa la mayor frecuencia, varios valores pueden tener la misma mayor frecuencia dentro del conjunto de datos. Si tienen los datos un valor de moda, es monomodal; si tienen dos, entonces será bimodal; si tienen tres, se dice que es trimodal y así sucesivamente.

3.2.2.1. Moda para Datos no Agrupados La principal ventaja de esta medida de posición, es la simplicidad con que se obtiene, ya que representa a la observación de mayor frecuencia. Por definición, la moda no es una medida matemática, porque cuando los datos no han sido agrupados, basta con ver que dato u observación se repite con más frecuencia, aunque se recomienda primero ordenarlos para verlos juntos y así determinar el o los valores de moda con más precisión.

z1 2 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios esueltos 1) Hallar la moda de los siguientes datos: 34, 26, 32, 26 y 20. Mo = 26

Ordenando: 20, 26, 26, 32, 34

2) Hallar la moda de los siguientes datos: 32, 34, 26, 32, 26 y 20. Mo = 26 y 32

Ordenando: 20, 26, 26, 32, 32, 34

3) Hallar la moda de los siguientes datos: 32, 34, 26, 32, 26, 34 y 20. Ordenando: 20, 26, 26, 32, 32, 34, 34

Mo = 26, 32 y 34

4) Hallar la moda de los siguientes datos: 20, 32, 34, 26, 32, 26, 34 y 20. Ordenando: 20, 20, 26, 26, 32, 32, 34, 34

Mo = No hay moda

El hecho de haber datos repetidos, no implica que necesariamente haya moda, en este último ejercicio, hay elementos repetidos pero no hay moda, debido a que todos se repiten exactamente en la misma cantidad, y para que haya moda, al menos una de las repeticiones debe ser distinta (Con los datos ordenados es más fácil identificar la moda).

Resolver los siguientes ejercicios propuestos, utilizando la Moda para Datos no Agrupados:

1) Hallar la moda de los siguientes datos: 1 458, 1 589, 1 251, 1651, 1452, 1 458, 1 251, 1 589, 1 458, 1 651, 1 920 y 1 325. Resp: 1 458. 2) Hallar la moda de los siguientes datos: 6, 12, 10, 6, 3, 4, 5, 5, 5, 7, 6, 9, 6, 7 Resp:

6.

3) Hallar la moda de los siguientes datos: 1 852, 1 857, 2 187, 1 587, 1 528, 1 678, 1 897 Resp: Sin Mo. 4) Hallar la moda de los siguientes datos: 76, 79, 75, 79, 88, 87, 88, 79, 88 Resp: 79 y 88.

z1 2 9 z


E S TA D Í S T I C A I

3.2.2.2. Moda para Datos Agrupados Cuando los datos están agrupados en intervalos, antes de determinar la moda habrá que localizar el intervalo que lo contiene o sea el intervalo modal. En los casos de que los intervalos sean de igual amplitud, el intervalo modal es donde se da la mayor frecuencia. En casos de distinta amplitud es donde se da la mayor función de densidad; en este texto solo se trabajará con intervalos de igual tamaño o amplitud. La principal desventaja que tiene la moda, es que solo considera el valor que más se repite, sin considerar la incidencia de los restantes.

Donde: Li

=

Límite inferior de la clase donde está la moda

Ls

=

Límite superior de la clase donde está la moda

N

=

Número total de datos

fi

=

Frecuencia absoluta de la clase donde está la moda

fi – 1

=

Frecuencia absoluta de la clase anterior a la posición de la moda.

fi + 1

=

Frecuencia absoluta de la clase posterior a la posición de la moda.

e

= Amplitud o tamaño de la clase donde está la moda (e = Ls – Li)

z1 3 0 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) Hallar la moda utilizando los siguientes datos agrupados: Remuneraciones

fi

600

1 000

21

1 000

1 400

58

1 400

1 800

65

1 800

2 200

28

2 200

2 600

16

2 600

3 000

10

3 000

3 400

2

Σ

200

Posición de la moda está en la tercera clase porque tiene la mayor frecuencia absoluta.

2) Hallar la moda utilizando los siguientes datos agrupados: Ventas fi

en millones 2

6

16

6

10

24

10

14

50

14

18

50

18

22

36

22

26

24

Σ

200

z1 3 1 z


E S TA D Í S T I C A I

Hay dos modas que se posicionan en la tercera y en la cuarta clase. Mo1 =

?

Li = 10;

∆1 = 50 – 24 = 26

Mo2 =

?

Li = 14;

∆1 = 50 – 50 = 0

fi = 50;

fi – 1 = 24;

fi + 1 = 50;

e = 10 – 14 = 4

∆2 = 50 – 50 = 0

fi = 50;

fi – 1 = 50;

fi + 1 = 36;

e = 14 – 18 = 4

∆2 = 50 – 36 = 14

Observe que no hay dos modas, solo hay una; esto sucede siempre cuando los valores de moda están juntos, por la interpolación ve las dos clases iguales y juntas como una sola. 3) Hallar la moda utilizando los siguientes datos agrupados: Alumnos

fi

20

40

4

40

60

15

60

80

20

80

100

38

100

120

26

120

140

38

140

160

5

160

180

4

Σ

150

Como la máxima frecuencia es 38 que se repite en la cuarta y sexta clase, hay dos modas que se posicionan en dichas clases. Mo1 = ?

Li = 80;

fi = 38;

fi – 1 = 20;

∆1 = 38 – 20 = 18

∆2 = 38 – 26 = 12

Mo2 = ?

fi = 38;

Li = 120;

fi – 1 = 26; z1 3 2 z

fi + 1 = 26;

fi + 1 = 5;

e = 100 – 80 = 20

e = 140 – 120 = 20


WA LT E R C É S P E D E S R A M Í R E Z

∆1 = 38 – 26 = 12

∆2 = 38 – 5 = 33

Ahora al encontrase las dos modas separadas, el proceso interpolatorio puede distinguir realmente que hay dos valores de modas.

4) Hallar la moda utilizando los siguientes datos agrupados: Producción

fi

2 000

6 000

6

6 000

10 000

14

10 000

14 000

20

14 000

18 000

30

18 000

22 000

16

22 000

26 000

14

Σ

100

Posición de la moda está en la cuarta clase porque tiene la mayor frecuencia absoluta. Mo = ?

Li = 14 000;

fi = 30;

fi – 1 = 20;

e = 18 000 – 14 000 = 4 000 ∆1 = 30 – 20 = 10

∆2 = 30 – 16 = 14

⎡ 10 ⎤ = 14 000 ⎢ ⎥ 4 000 = 15 666,67 ⎢⎣ 10 +14 ⎥⎦

z1 3 3 z

fi + 1 = 16;


E S TA D Ă? S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Moda para Datos Agrupados:

1) Hallar la moda utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 158,85

2) Hallar la moda utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 89,72

3) Hallar la moda utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 30 48 54 34 14 Resp: 1 446,15

4) Hallar la moda utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 16 25 18 10 5 Resp: 3 562,5

5) Hallar la moda utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 30 55 22 5 Resp: 65,45 y 84,31

z1 3 4 z


WA LT E R C É S P E D E S R A M � R E Z

6) Hallar la moda utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 10 26 35 35 10 9 Resp: 4 500,00

7) Hallar la moda utilizando los siguientes datos agrupados: Ventas

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 54 48 34 30 14 Resp: 1 170,00

8) Hallar la moda utilizando los siguientes datos agrupados: Utilidades

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 10 16 23 30 15 Resp: 5 318,18

z1 3 5 z



L e c c i ó n

3

3.3. CUANTILES Son un grupo de medidas estadísticas de posición o de localización, que no tienen una tendencia hacia el centro, con excepción de: el cuartil 2, el decil 5 y el percentil 50; porque son iguales a la mediana, por lo tanto son medidas que se localizan en el centro. El cuantil es un valor o dato que se encuentra en una posición definida, por lo tanto, para hallar un cuantil, primero se ve en qué posición se localiza y luego se toma el valor localizado. Si la posición del cuantil no es exacta, es necesaria una interpolación para determinar su valor, en caso contrario se toma el valor de la posición. Existe una gran variedad de cuantiles, pero los mayormente usados por Estadística, son:

3.3.1. Cuartiles (Qi) Representan la cuarta parte de los datos, producto de dividir la totalidad de los datos en 4 partes iguales. Los cuartiles son tres, que a partir del primer dato ordenado, se ubican: al 25% (Cuartil1), al 50% (Cuartil 2) y al 75% (Cuartil 3). Los cuartiles pueden ser hallados, tanto de datos no agrupados, como de datos agrupados.

3.3.1.1. Cuartiles para Datos no Agrupados Cuando la información o conjunto de datos no se encuentran agrupados, la posición o localización de los tres cuartiles, es: Q1 = 1(N+1) / 4;

Q2 = 2(N+1) / 4 z1 3 7 z

y

Q3 = 3(N+1) / 4


E S TA D Í S T I C A I

Si la posición es exacta, se toma el valor o dato de la posición; en caso contrario, el cuartil es hallado mediante la siguiente interpolación: Se toma el dato de la posición considerando solo la parte entera, más el producto de la parte decimal por la diferencia del dato tomado con el dato siguiente.

En todos los casos de interpolación para datos no agrupados, si la posición buscada es inferior a 1, se toma el primer dato; y, si la posición buscada es superior a la posición del último dato, se toma este último.

Ejercicios resueltos 1) Hallar todos los cuartiles con los siguientes datos: 125, 536, 485, 789, 584, 725 y 649. Solución: Ordenando los datos en forma creciente donde N = 7:

Posición Dato

1

2

3

4

5

6

7

125

485

536

584

649

725

789

Ubicación del cuartil 1:

Q1 = 1(N + 1) / 4 = 1(7 + 1) / 4 = 2

Q1 = es el dato de la posición 2 = 485 Ubicación del cuartil 2:

Q2 = 2(N + 1) / 4 = 2(7 + 1) / 4 = 4

Q2 = es el dato de la posición 4 = 584 Ubicación del cuartil 3:

Q3 = 3(N + 1) / 4 = 3(7 + 1) / 4 = 6

Q3 = es el dato de la posición 6 = 725

2) Hallar el cuartil 3 con los siguientes datos : 25, 36, 37, 52, 67, 19, 33, 50, 62, 44, 58 y 61. Ordenando los datos en forma creciente donde N = 12: Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

19

25

33

36

37

44

50

52

58

61

62

67

Ubicación del cuartil 3:

Q3 = 3(N + 1) / 4 = 3(12 + 1) / 4 = 9,75

Interpolación del Q3 = 58 + 0,75(61 – 58) = 60,25 z1 3 8 z


WA LT E R C É S P E D E S R A M Í R E Z

En la interpolación de la posición 9,75, se ha tomado el dato 9 (58), más 0,75 de la diferencia del dato 10 (61) menos el dato 9 (58). 3) Hallar el cuartil 1 utilizando los siguientes datos no agrupados: 71, 59, 33, 58, 63, 44, 38, 51, 68 y 61

56, 62, 74, 22,

Ordenando los datos en forma creciente donde N = 14:

Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

22

33

38

44

51

56

58

59

61

62

63

68

71

74

Ubicación del cuartil 1:

Q1 = 1(N + 1) / 4 = 1(14 + 1) / 4 = 3,75

Interpolación del Q1 = 38 + 0,75(44 – 38) = 42,5.

Resolver los siguientes ejercicios propuestos, utilizando Cuartiles para Datos no Agrupados: 1) Hallar el cuartil 3 utilizando los siguientes datos: 96, 105, 116, 88, 75, 110 y 127. Resp: 116 2) Hallar el cuartil 1 utilizando los siguientes datos: 24, 26, 28, 31, 33, 24, 28, 27 y 22. Resp: 24 3) Hallar el cuartil 2 utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87. Resp: 74

4) Hallar el cuartil 3 utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 276 y 295. Resp: 284 5) Hallar el cuartil 2 utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 571 y 1 562. Resp:

1 564

6) Hallar el cuartil 1 utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457. Resp:

24 178 z1 3 9 z


E S TA D Í S T I C A I

3.3.1.2. Cuartiles para Datos Agrupados Cuando la información o conjunto de datos se encuentran agrupados, la posición o localización de los tres cuartiles, es: Q1 = 1N / 4;

Q2 = 2N / 4

y

Q3 = 3N / 4

Una vez localizada la posición del cuartil, se procede a utilizar el mismo procedimiento interpolatorio de la mediana para datos agrupados, pero esta vez se realizará con la posición del cuartil.

Donde: Posición= Número del cuartil por “N” entre 4 Li

=

Límite inferior de la clase donde está el cuartil

Ls

=

Límite superior de la clase donde está el cuartil

N

=

Número total de datos

fi

=

Frecuencia absoluta de la clase donde está el cuartil

=

Frecuencia acumulada de la clase anterior a la posición del cuartil.

=

Amplitud o tamaño de la clase donde está el cuartil (e = Ls – Li)

Fi – 1 e

Ejercicios resueltos

1) Hallar los cuartiles: 1, 2 y 3; utilizando los siguientes datos agrupados:

Remuneraciones

fi

Fi

600

1 000

21

21

1 000

1 400

58

79

1 400

1 800

65

144

1 800

2 200

28

172

2 200

2 600

16

188

2 600

3 000

10

198

3 000

3 400

2

200

Σ

200 z1 4 0 z


WA LT E R C É S P E D E S R A M Í R E Z

Posición del cuartil 1: 1N / 4 = 1(200) / 4 = 50 Li = 1 000;

N = 200;

fi = 58;

Fi – 1 = 21;

e = 1 400 – 1 000 = 400

Posición del cuartil 2: 2N / 4 = 2(200) / 4 = 100 Li = 1 400;

N = 200;

fi = 65;

Fi – 1 = 79;

e = 1 800 – 1 400 = 400

Posición del cuartil 3: 3N / 4 = 3(200) / 4 = 150 Li = 1 800;

N = 200;

fi = 28;

Fi – 1 = 144;

e = 2 200 – 1 800 = 400

2) Hallar el cuartil 3 utilizando los siguientes datos no agrupados:

Dividendos

fi

Fi

1 600

2 000

21

2 000

2 400

78

99

2 400

2 800

85

184

2 800

3 200

48

232

3 200

3 600

36

268

3 600

4 000

20

288

4 000

4 400

12

300

Σ

21

300

Posición del cuartil 3: 3N / 4 = 3(300) / 4 = 225 Li = 2 800;

N = 300;

fi = 48;

Fi – 1 = 184;

z1 4 1 z

e = 3 200 – 2 800 = 400


E S TA D Ă? S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Cuartiles para Datos Agrupados:

1) Hallar el cuartil 1 utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 146,25

2) Hallar el cuartil 2 utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 89,15

3) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 30 48 54 34 14 Resp: 1 592,59

4) Hallar el cuartil 1 utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 16 25 18 10 5 Resp: 2 875,00

5) Hallar el cuartil 2 utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 30 55 20 5 Resp: 73,33

z1 4 2 z


WA LT E R C É S P E D E S R A M Í R E Z

6) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 10 26 35 35 10 9 Resp: 5 150,00

7) Hallar el cuartil 1 utilizando los siguientes datos agrupados: Ventas

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 54 48 34 30 14 Resp: 1 111,11

8) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Utilidades

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 10 16 23 30 15 Resp: 5 666,67

3.3.2. Deciles (Di) Representan la décima parte de los datos, producto de dividir la totalidad de los datos en 10 partes iguales. Los deciles son nueve, que a partir del primer dato ordenado, se ubican: al 10% (decil1), al 20% (decil 2) y así sucesivamente hasta el último, al 90% (decil 9). Los deciles pueden ser hallados, tanto de datos no agrupados, como de datos agrupados.

3.3.2.1. Deciles para Datos no Agrupados Cuando la información o conjunto de datos no se encuentran agrupados, la posición o localización de los nueve deciles, es: D1 = 1(N+1) / 10; D2 = 2(N+1) / 10;

D3 = 3(N+1) / 10 ... D9 = 9(N+1) / 10

Si la posición es exacta, se toma el valor o dato de la posición; en caso contrario, el decil es hallado mediante la misma interpolación del cuartil para datos no agrupados. z1 4 3 z


E S TA D Í S T I C A I

Ejercicios resueltos 1) Hallar los deciles 4 y 7 utilizando los siguientes datos no agrupados: 156, 122, 159, 133, 158, 144, 138, 151, y 161 Ordenando los datos en forma creciente donde N = 9: Posición Dato

1

2

3

4

5

6

7

8

122

133

138

144

151

156

158

159

Ubicación del decil 4:

9 161

D4 = 4(N + 1) / 10 = 4(9 + 1) / 10 = 4

D4 = es el dato de la posición 4 = 144 Ubicación del decil 7:

D7 = 7(N + 1) / 10 = 7(9 + 1) / 10 = 7

D7 = es el dato de la posición 7 = 158 2) Hallar el decil 6 utilizando los siguientes datos no agrupados: 58, 62, 77, 28, 71, 59, 35, 58, 63, 44, 38, 51, 68 y 61 Ordenando los datos en forma creciente donde N = 14: Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

28

35

38

44

51

58

58

59

61

62

63

68

71

77

Ubicación del decil 6:

D6 = 6(N + 1) / 10 = 6(14 + 1) / 10 = 9

D6 = es el dato de la posición 9 = 61 3) Hallar el decil 8 utilizando los siguientes datos no agrupados: 38, 16, 27, 28, 21, 21, 31, 19, 13, 24, 28, 15, 18, 27, 26 y 31 Ordenando los datos en forma creciente donde N = 16: Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

13

15

16

18

19

21

21

24

26

27

27

28

28

31

31

38

Ubicación del decil 8:

D8 = 8(N + 1) / 10 = 8(16 + 1) / 10 = 13,6

Interpolación del D8 = 28 + 0,6(31 – 28) = 29,8 4) Hallar el decil 3 utilizando los siguientes datos no agrupados: 564, 572, 545, 459, 468, 497, 485, 651, 612 y 542. Ordenando los datos en forma creciente donde N = 10: Posición Dato

1

2

3

4

5

6

7

8

9

10

459

468

485

497

542

545

564

572

612

651

Ubicación del decil 3:

D3 = 3(N + 1) / 10 = 3(10 + 1) / 10 = 3,3

Interpolación del D3 = 485 + 0,3(497 – 485) = 488,6 z1 4 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Resolver los siguientes ejercicios propuestos, utilizando Deciles para Datos no Agrupados:

1) Hallar el decil 3 utilizando los siguientes datos: 196, 105, 116, 188, 175, 110 y 127.

Resp:

112,4

2) Hallar el decil 7 utilizando los siguientes datos: 34, 46, 38, 41, 33, 44, 38, 47 y 32.

Resp:

44

3) Hallar el decil 9 utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87, 67.

Resp:

86,8

4) Hallar el decil 2 utilizando los siguientes datos: 276 y 295, 274 y 269.

Resp:

252, 264, 287, 264, 268, 278, 281,

264

5) Hallar el decil 6 utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 y 1 562.

Resp:

1 569

6) Hallar el decil 8 utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.

Resp:

24 783,6

3.3.2.2. Deciles para Datos Agrupados Cuando la información o conjunto de datos se encuentran agrupados, la posición o localización de los nueve deciles, es: D1 = 1N / 10;

D2 = 2N / 10;

D3 = 3N / 10

.

.

.

D9 = 9N / 10

Una vez localizada la posición del decil, se procede a utilizar el mismo procedimiento interpolatorio de la mediana para datos agrupados, pero esta vez se realizará con la posición del decil.

z1 4 5 z


E S TA D Í S T I C A I

Donde: Posición= Número del decil por “N” entre 10 Li

=

Límite inferior de la clase donde está el decil

Ls

=

Límite superior de la clase donde está el decil

fi

=

Frecuencia absoluta de la clase donde está el decil

=

Frecuencia acumulada de la clase anterior a la posición del decil.

e

=

Amplitud o tamaño de la clase donde está el decil (e = Ls – Li)

Fi – 1

Ejercicios resueltos

1) Hallar los deciles: 1, 5 y 8; utilizando los siguientes datos agrupados:

Ventas (en Miles)

fi

Fi

5 600

6 000

121

121

6 000

6 400

158

279

6 400

6 800

265

544

6 800

7 200

128

672

7 200

7 600

116

788

7 600

8 000

110

898

8 000

8 400

102

1 000

Σ

1 000

Posición del decil 1: 1N / 10 = 1(1 000) / 10 = 100 Li = 5 600;

N = 1 000;

fi = 121;

Fi – 1 = 0;

e = 6 000 – 5 600 = 400

Posición del decil 5: 5N / 10 = 5(1 000) / 10 = 500 Li = 6 400;

N = 1 000;

fi = 265;

z1 4 6 z

Fi – 1 = 279;

e = 6 800 – 6 400 = 400


WA LT E R C É S P E D E S R A M Í R E Z

Posición del decil 8: 8N / 10 = 8(1 000) / 10 = 800 Li = 7 600;

N = 1 000;

fi = 110;

Fi – 1 = 788;

e = 8 000 – 7 600 = 400

2) Hallar el decil 7 utilizando los siguientes datos no agrupados:

Consumos

fi

Fi

1 600

1 900

21

1 900

2 200

78

99

2 200

2 500

85

184

2 500

2 800

48

232

2 800

3 100

36

268

3 100

3 400

20

288

3 400

3 700

12

300

Σ

21

300

Posición del decil 7: 7N / 10 = 7(300) / 10 = 210 Li = 2 500;

N = 300;

fi = 48;

Fi – 1 = 184;

e = 2 800 – 2 500 = 300

⎡ Posición − fi−1 ⎤ ⎡ 210 −184 ⎤ ⎥ e = 2500 + ⎢ D7 = Li + ⎢ ⎥ 300 = 2662,50 ⎢⎣ ⎥ ⎥⎦ ⎢⎣ fi 48 ⎦

z1 4 7 z


E S TA D Ă? S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Deciles para Datos Agrupados:

1) Hallar el decil 1 utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 136,39

2) Hallar el decil 2 utilizando los siguientes datos agrupados: Toneladas

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 76,75

3) Hallar el decil 3 utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 30 48 54 34 14 Resp: 1 241,67

4) Hallar el decil 4 utilizando los siguientes datos agrupados: Produc.

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 16 25 18 10 5 Resp: 3 400,00

5) Hallar el decil 6 utilizando los siguientes datos agrupados: Evaluaciones

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 30 55 20 5 Resp: 80,00

z1 4 8 z


WA LT E R C É S P E D E S R A M Í R E Z

6) Hallar el decil 7 utilizando los siguientes datos agrupados: Compras

500 1500

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

fi 10 26 35 35 10 9 Resp: 3 971,43

7) Hallar el decil 8 utilizando los siguientes datos agrupados: Ventas

80 100

100 120

120 140

140 160

160 180

180 200

fi 6 44 32 24 10 4 Resp: 151,67

8) Hallar el decil 9 utilizando los siguientes datos agrupados: Utilidades

3000 4000

4000 5000

5000 6000

6000 7000

7000 8000

8000 9000

fi 16 30 46 43 40 25 Resp: 8 200,00

3.3.3. Percentiles (Pi) Representan la centésima parte de los datos, producto de dividir la totalidad de los datos en 100 partes iguales. Los percentiles son noventainueve, que a partir del primer dato ordenado, se ubican: al 1% (percentil1), al 2% (percentil 2) y así sucesivamente hasta el último, al 99% (percentil 99). Los percentiles pueden ser hallados, tanto de datos no agrupados, como de datos agrupados.

3.3.3.1. Percentiles para Datos no Agrupados Cuando la información o conjunto de datos no se encuentran agrupados, la posición o localización de los noventainueve percentiles, es: P1 = 1(N+1) / 100;

P2 = 2(N+1) / 100;

P3 = 3(N+1) / 100

P99 = 99(N+1) / 100 z1 4 9 z

. . .


E S TA D Í S T I C A I

Si la posición es exacta, se toma el valor o dato de la posición; en caso contrario, el percentil es hallado mediante la misma interpolación del cuartil o decil para datos no agrupados. Ejercicios resueltos 1) Hallar los percentiles 19 y 67 utilizando los siguientes datos no agrupados: 15, 6, 1, 22, 15, 9, 13, 3, 15, 8, 14, 4, 13, 8, 15, 1, 16, 10 y 19 Ordenando los datos en forma creciente donde N = 19:

Posición

1 2 3 4 5 6

7

8

9

10

11

12 13 14 15 16

Dato

1 1

8

9

10

13

13

14

3 4 6 8

Ubicación del percentil 19:

15 15 15

17

18

19

15 16

19

22

P19 = 19(N + 1) / 100 = 19(19 + 1) / 100 = 3,8

Interpolación del P19 = 3 + 0,8(4 – 3) = 3,8 Ubicación del percentil 67:

P67 = 67(N + 1) / 100 = 67(19 + 1) / 100 = 13,4

Interpolación del P67 = 15 + 0,4(15 – 15) = 15 2) Hallar los percentiles 52 y 91utilizando los siguientes datos no agrupados: 58, 62, 77, 28, 71, 59, 35, 58, 63, 44, 38, 51, 68 y 61

Ordenando los datos en forma creciente donde N = 14:

Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

28

35

38

44

51

58

58

59

61

62

63

68

71

77

Ubicación del percentil 52:

P52 = 52(N + 1) / 100 = 52(14 + 1) / 100 = 7,8

Interpolación del P52 = 58 + 0,8(59 – 58) = 58,8 Ubicación del percentil 91:

P91 = 91(N + 1) / 100 = 91(14 + 1) / 100 = 13,65

Interpolación del P91 = 71 + 0,65(77 – 71) = 74,9

z1 5 0 z


WA LT E R C É S P E D E S R A M Í R E Z

3) Hallar los percentiles 85 y 48 utilizando los siguientes datos no agrupados: 27, 28, 21, 21, 31, 19, 13, 24, 28, 15, 18, 27, 26 y 31

38, 16,

Ordenando los datos en forma creciente donde N = 16:

Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12 13

14

15

16

13

15

16

18

19

21

21

24

26

27

27

28

31

31

38

Ubicación del percentil 85:

28

P85 = 85(N + 1) / 100 = 85(16 + 1) / 100 = 14,45

Interpolación del P85 = 31 + 0,45(31 – 31) = 31 Ubicación del percentil 48:

P48 = 48(N + 1) / 100 = 48(16 + 1) / 100 = 8,16

Interpolación del P48 = 24 + 0,16(26 – 24) = 24,32

Resolver los siguientes ejercicios propuestos, utilizando Percentiles para Datos no Agrupados: 1) Hallar el percentil 23 utilizando los siguientes datos: 158, 162, 196, 105, 116, 188, 175, 110 y 127. Resp: 111,8 2) Hallar el percentil 37 utilizando los siguientes datos: 34, 46, 38, 41, 33, 44, 38, 47 y 32.

Resp: 36,8

3) Hallar el percentil 59 utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87, 67.

Resp: 74,98

4) Hallar el percentil 78 utilizando los siguientes datos: 152, 164, 187, 164, 168, 178, 181, 276, 295, 274 y 269.

Resp:

274,72

5) Hallar el percentil 82 utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 361, 355, 349 y 367.

Resp:

360,04

6) Hallar el percentil 66 utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 y 1 562. Resp: 1 572,6 7) Hallar el percentil 18 utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.

Resp:

24 168,76 z1 5 1 z


E S TA D Í S T I C A I

3.3.3.2. Percentiles para Datos Agrupados Cuando la información o conjunto de datos se encuentran agrupados, la posición o localización de los noventainueve percentiles, es: P1 = 1N / 100;

P2 = 2N / 100;

P3 = 3N / 100

.

.

.

P99 = 99N / 100

Una vez localizada la posición del percentil, se procede a utilizar el mismo procedimiento interpolatorio de la mediana para datos agrupados, pero esta vez se realizará con la posición del percentil.

Donde:

Posición = Número del percentil por “N” entre 100 Li

=

Límite inferior de la clase donde está el percentil

Ls

=

Límite superior de la clase donde está el percentil

N

=

Número total de datos

fi

=

Frecuencia absoluta de la clase donde está el percentil

e

Fi – 1

= Frecuencia acumulada de la clase anterior a la posición del percentil. =

Amplitud o tamaño de la clase donde está el percentil (e = Ls – Li)

Ejercicios resueltos

1) Hallar los percentiles: 21, 62 y 93; utilizando los siguientes datos agrupados:

Remuneraciones

fi

Fi

600

1 000

21

21

1 000

1 400

58

79

1 400

1 800

65

144

1 800

2 200

28

172

2 200

2 600

16

188

2 600

3 000

10

198

3 000

3 400

2

200

Σ

200

z1 5 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Posición del percentil 21: 21N / 100 = 21(200) / 100 = 42

Li = 1 000;

N = 200;

fi = 58;

Fi – 1 = 21;

e = 1 400 – 1 000 = 400

Posición del percentil 62: 62N / 100 = 62(200) / 100 = 124 Li = 1 400;

N = 200;

fi = 65;

Fi – 1 = 79;

e = 1 800 – 1 400 = 400

Posición del percentil 93: 93N / 100 = 93(200) / 100 = 186 Li = 2 200;

N = 200;

fi = 16;

Fi – 1 = 172;

e = 2 600 – 2 200 = 400

2) Hallar el percentil 33 utilizando los siguientes datos no agrupados:

Dividendos

fi

Fi

1 600

2 000

21

2 000

2 400

78

99

2 400

2 800

85

184

2 800

3 200

48

232

3 200

3 600

36

268

3 600

4 000

20

288

4 000

4 400

12

300

Σ

21

300

Posición del percentil 33: 33N / 100 = 33(300) / 100 = 99 Li = 2 000;

N = 300;

fi = 78;

z1 5 3 z

Fi – 1 = 21;

e = 2 400 – 2 000 = 400


E S TA D Ă? S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Percentiles para Datos Agrupados:

1) Hallar el percentil 95 utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 180,83

2) Hallar el percentil 82 utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 102,03

3) Hallar el percentil 73 utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 30 48 54 34 14 Resp: 1 577,78

4) Hallar el percentil 61 utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 16 25 18 10 5 Resp: 4 100,00

5) Hallar el percentil 42 utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 30 55 20 5 Resp: 68,91

z1 5 4 z


WA LT E R C É S P E D E S R A M � R E Z

6) Hallar el percentil 37 utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 10 26 35 35 10 9 Resp: 3 792,86

7) Hallar el percentil 21 utilizando los siguientes datos agrupados: Ventas

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 54 48 34 30 14 Resp: 1 081,48

8) Hallar el percentil 16 utilizando los siguientes datos agrupados: Utilidades

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 10 16 23 30 15 Resp: 3 000,00

z1 5 5 z



L e c c i ó n

4

3.4. Propiedades de las medidas de posición Las medidas de posición que son medidas de resumen, porque representan generalmente de alguna manera a todos los datos, tienen un comportamiento distinto ante los cambios de origen y ante los cambios de escala.

3.4.1. Cambio de origen Si a los valores que toma una variable X (recorrido de la variable) se le suma o se le resta un determinado número, se produce un cambio de origen en la variable original. Las medidas de posición de la variable X sufren modificaciones por ese cambio de origen, aunque no todas. Si a la Variable Xa se le resta o adiciona “k”, resulta: Xb = Xa ± k. Entonces:

(Xb)

=

(Xa)

± k

Me (Xb) = Me (Xa) ± k Mo (Xb) = Mo (Xa) ± k

z1 5 7 z


E S TA D Í S T I C A I

3.4.2. Cambio de escala Si a los valores que toma una variable X (recorrido de la variable) se le multiplica o divide por un determinado número, se produce un cambio de escala en la variable original. Las medidas de posición central de la variable X sufren modificaciones por ese cambio de escala, salvo el coeficiente de variación.

Si a la Variable Xa se le multiplica “k”, resulta: Entonces:

(Xb) = k

Xb = Xa (a). (Xa)

Me (Xb) = k Me (Xa) Mo (Xb) = k Mo (Xa)

También, Si a la Variable Xa se le divide entre “k”, resulta: Xb = Xa / k. Entonces:

(Xb)

=

(Xa)

/k

Me (Xb) = Me (Xa) / k Mo (Xb) = Mo (Xa) / k

La comprobación de estas propiedades quedan para el lector, quién propondrá los ejercicios y cambios que crea conveniente.

z1 5 8 z


WA LT E R C É S P E D E S R A M Í R E Z

AUTOEVALUACIÓN Nº 3 1) ¿Cuál es el promedio de edad de una familia de 5 miembros, cuyas edades son: 3, 12, 17, 39 y 44 años? A) 24

B) 30

C) 29

D) 23

E) 26

2) Un alumno ha sido evaluado con los siguientes calificativos: 10, 16, 18, 11, 12 y 13. Si las cuatro primeras evaluaciones corresponden a notas de prácticas, la quinta es un examen que vale el doble que una práctica y la última es otro examen que vale el doble que el examen anterior. ¿Cuál es el promedio final del alumno? A) 12,22

B) 12,94

C) 13,10

D) 14,15

E) 13,85

3) Hallar la media aritmética utilizando los siguientes datos agrupados: Utilidades fi A) 2 220

1000 1500

1500 2000

2000 2500

2500 3000

3000 3500

3500 4000

15

30

23

16

10

6

B) 3 025

C) 2 918

D) 2 233

E) 3 251

4) Si las entradas para el futbol cuestan: 40 soles para adultos y 5 soles para niños, ¿cuál es la proporción de adultos pagantes para ver el fútbol si el promedio fue de 12 soles? A) 29,44%

B) 20.00%

C) 21,22%

D) 28,36%

E) 26,16%

5) ¿Cuál es el promedio geométrico de las variaciones anuales de una cuenta de ahorros sujeta a interés compuesto, si las variaciones son: 2 458, 2615,22, 2 815,45, 3014,17 y 3 312,26? A) 2 944,46

B) 2 827,39

C) 2 719,92

D) 2 189,96

E) 2 616,17

6) Hallar la media geométrica utilizando los siguientes datos agrupados: Depósitos

1000 1500

1500 2000

2000 2500

2500 3000

3000 3500

3500 4000

fi

18

45

88

36

20

13

A) 2 243,16

B) 2 150,25

C) 2 718,56

D) 3 012,15

E) 3 123,22

7) Un ciclista realiza tres veces el mismo recorrido ¿Cuál es el promedio de velocidad, si va a: 85, 90 y 60 Km por hora? A) 76,22 km/h

B) 80,12 km/h

C) 79,94 km/h z1 5 9 z

D) 81,15 km/h

E) 75,87 km/h


E S TA D Í S T I C A I

8) Hallar la media armónica o promedio de velocidad de operación de 5 operarias que producen: 350 artículos a 25 artículos por día, 320 artículos a 28 artículos por día, 320 artículos a 32 artículos por día, 380 artículos 30 artículos por día y 360 artículos a 20 artículos por día. A) 29,28 art/día

B) 20,18 art/día

C) 19,81 art/día

D) 20,16 art/día E) 26,17 art/día.

9) Hallar la mediana utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 1 587 y 1 562. A) 1 566

B) 1 573

C) 1 564

D) 1 568

E) 1 562

10) Hallar la mediana utilizando los siguientes datos agrupados: Azúcar (Kg)

140 145

145 150

150 155

155 160

160 165

165 170

fi 10 18 28 40 34 20 A) 149,254

B) 147,253

C) 157,375

D) 148,125

E) 152,150

11) Hallar la moda utilizando los siguientes datos agrupados: Avena (Kg)

140 145

145 150

150 155

155 160

160 165

165 170

fi 8 20 28 40 32 22 A) 157

B) 158

C) 155

D) 159

E) 156

12) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Producción

1800 2000

2000 2200

2200 2400

2400 2600

2600 2800

fi 25 40 80 45 10 A) 2 541,45

B) 2 425,30

C) 2 395,58

D) 2 422,22

E) 2 512,15

13) Hallar el decil 7 utilizando los siguientes datos agrupados: Compras

80 100

100 120

120 140

140 160

160 180

180 200

200 220

fi 15 36 62 41 30 14 12 A) 154,54

B) 147,25

C) 149,45 z1 6 0 z

D) 151,12

E) 156,59


WA LT E R C É S P E D E S R A M � R E Z

14) Hallar el percentil 65 utilizando los siguientes datos: 748, 758, 723, 756, 718, 719, 722, 735, 734, 782, 756, 727, 741, 745, 766, 771, 763, 790 y 756, A) 748

B) 756

C) 758

D) 763

E) 766

15) Hallar el percentil 34 utilizando los siguientes datos agrupados: Ventas

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 54 48 34 30 14 A) 1 049,54

B) 1 407,25

C) 1 125,17

D) 1 074,07

E) 1152,15

Respuestas de control 1. D, 2. C, 3. A, 4. B, 5. B, 6. A, 7. E, 8. E, 9. A, 10. C, 11. B, 12. D, 13. E, 14. B, 15. D

z1 6 1 z


E S TA D Í S T I C A I

GLOSARIO

Antilogaritmo.

Es la inversa del logaritmo, porque es la base que tiene como potencia el logaritmo.

Cálculo algebraico.

Se refiere a las operaciones matemáticas.

Datos Agrupados.

Es un conjunto de datos que ha sido ordenado en tablas de distribución de frecuencias.

Logaritmo.

Es el exponente al cual hay que elevar la base para obtener dicho número. Todo logaritmo tiene como base a un número mayor de 1, y el logaritmo mayormente utilizado es el logaritmo vulgar cuya base es 10.

Observación.

En sstadística, observación es sinónimo de dato.

Sumando.

Es un valor que se habrá de agregar, aunque algunas veces también puede disminuir.

Teoría de los Sondeos.

Es una medición tomada a partir de encuestas destinadas a conocer la opinión pública. Estas mediciones se realizan por medio de muestreos que, usualmente, están diseñados para representar las opiniones de una población llevando a cabo una serie de preguntas. Es un sondeo de opinión.

EXPLORACIÓN ON LINE http://www.tuveras.com/estadistica/estadistica02.htm http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml http://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica) http://es.wikipedia.org/wiki/Media_aritm%C3%A9tica

z1 6 2 z


c u a r t a

UNIDAD Medidas de Dispersión o de Variabilidad

Dispersión con relación a una medida de posición centarl: Desviación Media, Desviación Mediana, Varianza, Desviación Estándar Dispersióne entre medidas o entre datos de posición no central: Rango o recorrido de la variable, Variación Cuartílica, Variación Percentílica Dispersión relativa: Coeficiente de Variación, Variable Estándar, Otras medidas de dispersión relativa


OBJETIVO (S) GENERAL Aprender que las medidas de dispersión también son medidas de resumen que se caracterizan por determinar si los datos u observaciones, se encuentran concentrados o dispersos, ya que no es suficiente conocer la posición, sino que además es necesario conocerlos en conjunto como son. Las medidas de variabilidad, son de tres tipos: unas son determinadas con relación a una medida de tendencia central, otras son determinadas con relación a medidas o datos de tendencia no central, y finalmente existen medidas de variabilidad de carácter relativo. De los tipo de medidas de variabilidad mencionados, los dos primeros son de tipo absoluto, que permiten comparar variaciones entre unidades de la misma especie, por ello son utilizadas dentro de un conjunto de datos; mientras que las de carácter relativos, permiten comparar las variaciones entre dos o más conjuntos de datos aún con unidades de medidas diferentes. ESPECÍFICOS • Conocer el uso de las medidas de variabilidad con relación a las medidas de tendencia central, en donde se emplearán tanto los datos no agrupados como los agrupados, a través de la varianza y de la desviación estándar. • Saber cómo utilizar la variabilidad de los datos con relación a otras medidas de tendencia no central, también para datos agrupados, como no agrupados, a través de los diferentes rangos. • Determinar cómo se utiliza la dispersión relativa y cuál es su importancia al ser comparada con otros datos de otra magnitud.


L e c c i ó n

1

4.1. DISPERSIÓN CON RELACIÓN A UNA MEDIDA DE POSICIÓN CENTRAL

Mientras las medidas de posición indican los valores centrales hacia los cuales tienden los valores de las variables, las medidas de dispersión se pueden determinar con relación a una medida de tendencia central, que se encargan de definir el grado de variación o de desviación que existen entre ellos. Los valores centrales pierden significación cuando la dispersión es alta, razón por la cual estas medidas complementan las anteriores; además, la importancia de estas medidas de variabilidad, radica en que permite conocer como son los datos u observaciones en su conjunto, nos dice en qué medida si son más homogéneos o menos homogéneos.

4.1.1. Desviación Media (D X ) Es una medida de dispersión o de variabilidad de tipo absoluta, que se da en valores igualmente absolutos o sea sin signos. Se obtiene mediante la diferencia absoluta de cada una de las observaciones o datos con la media aritmética, divididos entre el número de datos; por ello, esta medida es conocida como un promedio de variaciones respecto a la media. Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha

z1 6 5 z


E S TA D Í S T I C A I

función al no ser derivable; es decir, que la medida independientemente de la variable no tiene un tratamiento de una función matemática continua, sino discreta. Conforme se presentan las observaciones dentro de una muestra o de una población, donde los datos pueden o no estar agrupados, la desviación media se define de la siguiente manera:

4.1.1.1. Desviación Media para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la deviación media se define de la siguiente manera:

Donde: Xi

=

Variable

=

Número total de datos o número de observaciones

=

Media Aritmética

N

Ejercicios resueltos 1) Hallar la desviación media utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:

z1 6 6 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar la desviación media utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44. Solución:

3) Hallar la desviación media utilizando los siguientes datos: 1546, 4852, 5782, 3238,5258 y 6456. Solución:

z1 6 7 z


E S TA D Í S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Desviación Media para Datos no Agrupados:

1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la desviación media por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.

Resp:

0,31

2) Hallar la desviación media de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.

Resp:

7,75

3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la desviación media de remuneraciones?

Resp:

748,80

4) Hallar la desviación media de los consumos de energía eléctrica mensual en Kw de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.

Resp:

15,33

5) Hallar la desviación media de asistencia de: 118, 107, 115, 110 y 120.

Resp:

4,40

6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la desviación media.

Resp:

84,00

7) Hallar la desviación media de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.

Resp:

22,17

8) Hallar la desviación media de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302.

Resp:

26,33

4.1.1.2. Desviación Media para Datos Agrupados Cuando los datos u observaciones que se estudian o se investigan, se encuentran agrupados en tablas de distribución de frecuencias, la deviación media se define de la siguiente manera:

z1 6 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Donde: fi

= Frecuencia absoluta

n

= Número de marcas de clase o veces que cambia el valor de la variable

Xi = Variable o marca de clase

N = Suma de las frecuencias absolutas o total de datos u observaciones.

X

= Media Aritmética

Ejercicios resueltos

1) Hallar la desviación media utilizando los siguientes datos agrupados: Compras fi

25 35

35 45

45 55

55 65

65 75

75 85

85 95

95 105

16

24

25

40

35

30

20

10

Solución:

z1 6 9 z


E S TA D ร S T I C A I

2) Hallar la desviaciรณn media utilizando los siguientes datos agrupados: Consultas

251 259

260 268

2

12

fi

269

277

278 286

287 295

296 304

305 313

10

6

6

4

10

Soluciรณn:

3) Hallar la desviaciรณn media utilizando los siguientes datos agrupados:

Invitaciones fi

30 36 37 43 44 50 51 57 58 64 65 71 72 78 79 85 4

6

20

25

Soluciรณn:

z1 7 0 z

20

15

6

4


WA LT E R C É S P E D E S R A M Í R E Z

Resolver los siguientes ejercicios propuestos, utilizando Desviación Media para Datos Agrupados:

1) Hallar la desviación media utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 15 18 26 36 20 10 Resp: 12,06

2) Hallar la desviación media utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 11 25 40 65 37 14 8 Resp: 11,01

3) Hallar la desviación media utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 14 30 48 54 34 20 Resp: 230,08

4) Hallar la desviación media utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 4 16 25 18 12 5 Resp: 1064,06

z1 7 1 z


E S TA D Í S T I C A I

5) Hallar la desviación media utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 5 25 55 45 38 22 10 Resp: 11,66 6) Hallar la desviación media utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 14 26 35 28 17 5 Resp: 1 084,80

4.1.2. Desviación Mediana (DM) Es una medida de dispersión o de variabilidad de tipo absoluta, que se da en valores absolutos (sin signos), entre cada una de las observaciones o datos con la mediana, divididos entre el número de datos; por ello, esta medida es conocida como un promedio de variaciones respecto a la mediana. La desviación mediana debería también llamarse desviación absoluta respecto a la mediana. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función ya que tampoco es derivable; es decir, que la medida independientemente de la variable no tiene un tratamiento de una función continua, sino un tratamiento discreto. Además como ya es conocido, si la medina es utilizada cuando los datos no tienen una media representativa, esta medida solo tiene real importancia solo en estos casos. Conforme se presentan las observaciones dentro de una muestra o de una población, donde los datos pueden o no estar agrupados, la desviación mediana que es utilizable cuando la media aritmética pierde credibilidad, sobre todo por la gran influencia de valores extremos, se define esta medida de dispersión de la siguiente manera:

4.1.2.1. Desviación Mediana para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la deviación mediana se define de la siguiente manera:

z1 7 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Donde: Xi

=

Variable

=

Número total de datos o número de observaciones

Me

=

Mediana

N

Ejercicios resueltos

1) Hallar la desviación mediana utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.

Solución: Ordenando los datos en forma creciente, se tiene:

Posición de la Me = (N+1) / 2 = (11+1) / 2 = 6

Me = 424

2) Hallar la desviación mediana utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44.

Solución: Ordenando los datos en forma creciente, se tiene:

Posición de la Me = (N+1) / 2 = (10+1) / 2 = 5,5

z1 7 3 z

Me = (47 + 48) / 2 = 47,5


E S TA D Í S T I C A I

3) Hallar la desviación mediana utilizando los siguientes datos: 1546, 4852, 5782, 3238,5258 y 6456. Solución: Ordenando los datos en forma creciente, se tiene:

Posición de la Me = (N+1) / 2 = (6+1) / 2 = 3,5

Me = (4 852 + 5 258) / 2 = 5 055

Resolver los siguientes ejercicios propuestos, utilizando Desviación Mediana para Datos no Agrupados:

1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la desviación mediana por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.

Resp:

0,31

2) Hallar la desviación mediana de los siguientes jornales: 65, 58, 67, 72, 75, 85, 60 y 55.

Resp:

7,63

3) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la desviación mediana de remuneraciones?

Resp:

710,00

4) Hallar la desviación mediana de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 323.

Resp:

14,92

5) Hallar la desviación mediana de asistencia de: 118, 107, 115, 110 y 120.

Resp:

4,20

6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la desviación mediana.

Resp:

82,86 z1 7 4 z


WA LT E R C É S P E D E S R A M Í R E Z

7) Hallar la desviación mediana de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.

Resp:

21,33

8) Hallar la desviación mediana de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302. Resp:

26,17

4.1.2.2. Desviación Mediana para Datos Agrupados Cuando los datos u observaciones que se investigan o se analizan, se encuentran agrupados en tablas de distribución de frecuencias, la deviación mediana se define de la siguiente manera:

Donde: fi Xi

=

Frecuencia absoluta

=

Variable o marca de clase

n

=

Número de marcas de clase o veces que cambia el valor de la variable

N

=

Suma de las frecuencias absolutas o total de datos u observaciones.

Me =

Mediana

Ejercicios resueltos 1) Hallar la desviación mediana utilizando los siguientes datos agrupados:

Rem. fi

600 1000 21

1000 1400 1400 1800 58

65

z1 7 5 z

1800 2200

2200 2600

2600 3000

28

16

12


E S TA D Í S T I C A I

Solución:

Posición de la mediana: N / 2 = 200 / 2 = 100 Li = 1 400;

N = 200;

fi = 65;

Fi – 1 = 79;

e = 1 800 – 1 400 = 400

⎡ 100 − 79 ⎤ Me = 1400 + ⎢ ⎥ 400 = 1529, 23 ⎥⎦ ⎢⎣ 65

2) Hallar la desviación mediana utilizando los siguientes datos agrupados:

Ventas (en millones)

2

fi

6 16

6 10

10 14

14 18

18 22

22 26

22

62

40

36

24

Solución:

Posición de la mediana: N / 2 = 200 / 2 = 100 Li = 10;

N = 200;

fi = 62;

z1 7 6 z

Fi – 1 = 38;

e = 14 – 10 = 4


WA LT E R C É S P E D E S R A M Í R E Z

3) Hallar la desviación mediana utilizando los siguientes datos agrupados:

Alumnos fi

20 40 4

40 60 16

60 80

80 100

36

40

100 120 120 140 26

19

140 160 160 180 5

4

Solución:

Posición de la mediana: N / 2 = 150 / 2 = 75 Li = 80;

N = 150;

fi = 40;

z1 7 7 z

Fi – 1 = 56;

e = 100 – 80 = 20


E S TA D Í S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando Desviación Mediana para Datos Agrupados:

1) Hallar la desviación mediana utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 11,72 2) Hallar la desviación mediana utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 10,83 3) Hallar la desviación mediana utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 20 30 48 54 34 14 Resp: 231,85 4) Hallar la desviación mediana utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 6 16 25 18 10 5 Resp: 1 051,00 5) Hallar la desviación mediana utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 45 38 22 5 Resp: 11,88 6) Hallar la desviación mediana utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 10 26 35 28 17 9 Resp: 1 114,97

z1 7 8 z


WA LT E R C É S P E D E S R A M Í R E Z

4.1.3. Varianza (S2) Es la medida estadística de dispersión de tipo absoluta que mide el grado de variabilidad que sintetiza el grado de homogeneidad o heterogeneidad de las diferencias individuales entre los casos de una muestra o de una población respecto de una variable numérica. En Estadística se acostumbra para diferenciar una varianza de una muestra, con la varianza de una población, simbolizando a la muestra como S2 y a la población como σ2. La varianza es el promedio de las diferencias o desviaciones al cuadrado de cada una de las observaciones respecto a la media aritmética. Existe un método abreviado que es la diferencia entre el momento de orden 2 con relación al origen (definido en la siguiente unidad), con la media aritmética al cuadrado; la varianza es de mucha utilidad en Estadística debido a que es una función derivable; es decir, que la medida independientemente de la variable tiene un tratamiento de una función matemática continua. En teoría de Probabilidad y Estadística la varianza es un estimador de la divergencia de una variable aleatoria X2 de su valor esperado E[x]2; esta definición de la varianza, es la misma que se definió como método abreviado; donde, la variable aleatoria al cuadrado es el momento del orden 2, y el valor esperado al cuadrado es la media aritmética al cuadrado. La varianza se da en unidades al cuadrado, por lo que se recomienda al calcular esta medida de dispersión, adicionar al resultado obtenido u2. Conforme se presentan las observaciones dentro de un conjunto de datos, donde los datos pueden o no estar agrupados, la varianza se define de la siguiente manera:

4.1.3.1. Varianza para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la varianza se define de la siguiente manera:

Donde: Xi

N

X

=

Variable

=

Número total de datos o número de observaciones

=

Media Aritmética z1 7 9 z


E S TA D Í S T I C A I

Ejercicios resueltos

1) Hallar la varianza utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.

Solución:

Si usted utiliza la segunda fórmula (denominada abreviada, porque la desviación o diferencia, se realiza al final), se obtiene el mismo resultado que obtuvo con la primera fórmula. 2) Hallar la varianza utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44. Solución:

z1 8 0 z


WA LT E R C É S P E D E S R A M Í R E Z

3) Hallar la varianza utilizando los siguientes datos: 1546, 4852, 5782, 3238, 5258 y 6456. Solución:

Resolver los siguientes ejercicios propuestos, utilizando Varianza para Datos no Agrupados:

1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la varianza por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.

Resp:

0,17 u2

2) Hallar la varianza de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55. Resp:

86,5 u2

3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la varianza de remuneraciones?

Resp:

769 784 u2

z1 8 1 z


E S TA D Í S T I C A I

4) Hallar la varianza de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322. Resp: 361,17 u2 5) Hallar la varianza de asistencia de: 118, 107, 115, 110 y 120.

Resp:

23,60 u2

6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la varianza.

Resp:

9 435,43 u2

7) Hallar la varianza de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.

Resp:

728 u2

8) Hallar la varianza de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302.

Resp:

1 261,17 u2

4.1.3.2. Varianza para Datos Agrupados Cuando los datos u observaciones que se estudian o se investigan, se encuentran agrupados en tablas de distribución de frecuencias, la varianza se define de la siguiente manera:

Donde: fi

=

Frecuencia absoluta

Xi

=

Variable o marca de clase

n

= Número de marcas de clase o veces que cambia el valor de la variable

N

=

Suma de las frecuencias absolutas o total de datos u observaciones.

X

=

Media Aritmética

Utilizando la segunda fórmula que es denominada abreviada, se obtiene el mismo resultado que obtuvo con la primera, como se sabe, lo mismo ocurre con los datos no agrupados.

z1 8 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) Hallar la varianza utilizando los siguientes datos agrupados:

Compras fi

25 35

35 45

45 55

55 65

65 75

75 85

85 95

95 105

16

24

25

40

35

30

20

10

Solución:

2) Hallar la varianza utilizando los siguientes datos agrupados:

Consultas fi

251 259

260 268

2

12

269

277

278 286

287 295

296 304

305 313

10

6

6

4

10

Solución:

z1 8 3 z


E S TA D Ă? S T I C A I

3) Hallar la varianza utilizando los siguientes datos agrupados:

Invitaciones fi

30 36 37 43 44 50 51 57 58 64 65 71 72 78 79 85 4

6

20

25

20

15

6

4

SoluciĂłn:

Resolver los siguientes ejercicios propuestos, utilizando Varianza para Datos Agrupados:

1) Hallar la varianza utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 15 18 26 36 20 10 Resp: 205,67 u2 z1 8 4 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar la varianza utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 11 25 40 65 37 14 8 Resp: 199,11 u2 3) Hallar la varianza utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

fi 14 30 48 54 34 20 Resp: 75 824 u2 4) Hallar la varianza utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

fi 4 16 25 18 12 5 Resp: 1 617 343,75 u2 5) Hallar la varianza utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 5 25 55 45 38 22 10 Resp: 207,84 u2 6) Hallar la varianza utilizando los siguientes datos agrupados: Compras

1500 2500

2500 3500

3500 4500

4500 5500

5500 6500

6500 7500

fi 14 26 35 28 17 5 Resp: 1 750 144 u2

4.1.4. Desviación Estándar (S) Es la medida estadística de dispersión de tipo absoluta que mide el grado de variabilidad en la misma unidad de origen. En Estadística se acostumbra para diferenciar una desviación estándar de una muestra, con la desviación estándar de una población, simbolizando a la muestra como S y a la población como σ.

z1 8 5 z


E S TA D Í S T I C A I

La desviación estándar o desviación típica es la raíz cuadrada de la varianza, es de mucha utilidad en estadística debido a que conserva las bondades de la varianza y además se expresa en la misma unidad de las observaciones que se investiga. Conforme se presentan las observaciones dentro de un conjunto de datos, donde los datos pueden o no estar agrupados, la desviación estándar se define de la siguiente manera:

4.1.4.1. Desviación Estándar para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la desviación estándar se define de la siguiente manera:

Donde: Xi

= Variable

N

= Número total de datos o número de observaciones

X

= Media Aritmética

Usted puede utilizar cualquiera de las fórmulas arriba indicadas, porque con ambas se obtiene el mismo resultado. Comparando las medidas de dispersión con relación a una medida central, se tiene: DM ≤ D ≤ S

z1 8 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos

1) Hallar la desviación estándar utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.

Solución:

2) Hallar la desviación estándar utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44. Solución:

z1 8 7 z


E S TA D Í S T I C A I

3) Hallar la desviación estándar utilizando los siguientes datos: 1546, 4852, 5782, 3238, 5258 y 6456. Solución:

Resolver los siguientes ejercicios propuestos, utilizando Desviación Estándar para Datos no Agrupados:

1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la desviación estándar por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.

Resp:

0,41

2) Hallar la desviación estándar de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.

Resp:

9,30

3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la desviación estándar de remuneraciones?

Resp:

877,37

4) Hallar la desviación estándar de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.

Resp:

19,00

5) Hallar la desviación estándar de asistencia de: 118, 107, 115, 110 y 120

Resp:

4,86 z1 8 8 z


WA LT E R C É S P E D E S R A M Í R E Z

6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la desviación estándar.

Resp:

97,14

7) Hallar la desviación estándar de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.

Resp:

26,98

8) Hallar la desviación estándar de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302.

Resp:

35,51.

4.1.4.2. Desviación Estándar para Datos Agrupados Cuando los datos u observaciones que se estudian o se investigan, se encuentran agrupados en tablas de distribución de frecuencias, la desviación estándar se define de la siguiente manera:

Donde: fi

= Frecuencia absoluta

Xi

=

Variable o marca de clase

n

=

Número de marcas de clase o veces que cambia el valor de la variable

N

=

Suma de las frecuencias absolutas o total de datos u observaciones.

X = Media Aritmética Usted puede utilizar cualquiera de las fórmulas arriba indicadas, porque con ambas se obtiene el mismo resultado.

Ejercicios resueltos 1) Hallar la desviación estándar utilizando los siguientes datos agrupados:

Compras fi

25 35

35 45

45 55

55 65

65 75

75 85

85 95

95 105

16

24

25

40

35

30

20

10

z1 8 9 z


E S TA D ร S T I C A I

Soluciรณn:

2) Hallar la desviaciรณn estรกndar utilizando los siguientes datos agrupados:

Consultas fi

251 259

260 268

2

12

269

277

10

Soluciรณn:

z1 9 0 z

278 286

287 295

296 304

305 313

10

6

6

4


WA LT E R C É S P E D E S R A M Í R E Z

3) Hallar la desviación estándar utilizando los siguientes datos agrupados:

Invitaciones fi

30 36 37 43 44 50 51 57 58 64 65 71 72 78 79 85 4

6

20

25

20

15

6

4

Solución:

Resolver los siguientes ejercicios propuestos, utilizando Desviación Estándar para Datos Agrupados:

1) Hallar la desviación estándar utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 15 18 26 36 20 10 Resp: 14,34

2) Hallar la desviación estándar utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 11 25 40 65 37 14 8 Resp: 14,11

z1 9 1 z


E S TA D Í S T I C A I

3) Hallar la desviación estándar utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

14 30 48 54 34 20 fi Resp: 275,36

4) Hallar la desviación estándar utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

4 16 25 18 12 5 fi Resp: 1 271,75

5) Hallar la desviación estándar utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

5 25 55 45 38 22 10 fi Resp: 14,42

6) Hallar la desviación estándar utilizando los siguientes datos agrupados: Compras

1500

2500

3500

4500

5500

6500

2500

3500

4500

5500

6500

7500

14 26 35 28 17 5 fi Resp: 1 322,93

z1 9 2 z


L e c c i ó n

2

4.2. DISPERSIÓN ENTRE MEDIDAS O ENTRE DATOS DE POSICIÓN NO CENTRAL

Otra manera de medir la variabilidad que presentan las observaciones o datos, es haciendo comparaciones entre valores que se encuentren por arriba y por debajo de un valor central; esta forma de dispersión, se denomina rango y se da en forma absoluta. Si la dispersión se realiza entre dos cuantiles, se dice que es una variación o rango entre medidas. Cuando la dispersión se realiza entre dos valores extremos, el rango resultante, se denomina recorrido de la variable que es una variación entre datos. El rango carece de significado, si es que los valores que lo determinan, no tiene una posición conocida. Existen varios tipos de rangos, pero los más importantes por el uso que le da la Estadística, son los siguientes:

4.2.1. Rango Simple (R) Es una variación entre datos, porque es la diferencia entre el mayor y el menor valor observado entre todos los datos, por ello representa el recorrido de toda la variable. Posee limitaciones similares a la de la moda, porque en el rango no intervienen los demás datos, solo intervienen los valores extremos. z1 9 3 z


E S TA D Í S T I C A I

Estadística utiliza este tipo de rango en la construcción de las tablas de distribución de frecuencias por intervalos o clase, como el rango es una diferencia numérica entre dos valores, solo se aplica a variables cuantitativas. La relación del rango con la desviación media, es la siguiente: 0 ≤ D ≤ ½R

4.2.1.1. Rango Simple de Variable Discreta El recorrido de la variable para variables discretas, se define de la siguiente manera: R = Dato máximo – Dato mínimo + 1

Ejercicios resueltos 1) Hallar el rango simple del número de asistente a un ciclo de conferencias: 648, 628, 625, 649, 712, 572, 549 y 616. Solución: Dato máximo =

712

Dato mínimo = 549

R = 712 – 549 + 1 = 164

2) Hallar el rango simple del número de matrículas por ciclo académico: 129, 96, 225, 64, 71, 172, 59, 110, 124 y 116. Solución: Dato máximo =

225

Dato mínimo = 59

R = 225 – 59 + 1 = 167

3) Hallar el rango simple del número de consultas diarias en una semana a una página web: 3 547, 2 879, 5 916, 10 453, 1 567, 5 789 y 8 543. Solución: Dato máximo =

10 453

Dato mínimo = 1 567

R = 10 453 – 1 567 + 1 = 8 887

z1 9 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Resolver los siguientes ejercicios propuestos, utilizando Rango Simple de Variable Discreta: 1) Si 7 tiendas venden el mismo producto en las siguientes cantidades, hallar el rango simple: 15, 20, 13, 50, 17, 80 y 50.

Resp:

66

2) Hallar el rango simple de las siguientes compras en unidades: 65, 58, 66, 72, 75, 85, 60 y 55. Resp: 31 3) Si un anualmente una página web es visitada por: 27 900, 26 450, 29 450 30 820 y 30 450 personas. ¿Cuál fue el rango simple del número de visitas a la página web? Resp: 4 371 4) Hallar el rango simple del número de quejas anuales de clientes: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.

Resp: 66

5) Hallar el rango simple de asistencia de: 118, 107, 115, 110 y 120.

Resp:

14

6) Las visitas anuales durante 7 años a un museo son: 1 785, 1 489, 1 758, 1 648, 1 797, 1 596 y 1 619 unidades, hallar el rango simple.

Resp:

309

7) Hallar el rango simple de las siguientes reclamos anuales a Indecopi: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.

Resp:

83

8) Hallar el rango simple del número de consumos con error de facturación: 328, 381, 250, 350, 273, 255, 298, 312, 305, 201, 317 y 302.

Resp: 181

4.2.1.2. Rango Simple de Variable Continua El recorrido de la variable para variables continuas, se define de la siguiente manera: R = Dato máximo – Dato mínimo

z1 9 5 z


E S TA D Í S T I C A I

Ejercicios resueltos 1) Hallar el rango simple del número de las ventas diarias de una tienda: 64,80; 62,80; 62,50; 64,90; 71,20; 57,20; 54,90 y 61,60 soles. Solución: Dato máximo =

71,20

Dato mínimo = 54,90

R = 71,20 – 54,90 = 16,30 soles

2) Hallar el rango simple de las edades de un grupo de escolares: 12, 10, 9, 13, 14, 16, 17, 7, 8, 9, 11, 13, 15, 17, 15 y 10 años. Solución: Dato máximo =

17

Dato mínimo = 7

R = 17 – 7 = 10 años

3) Si la producción anual de una empresa es la siguiente: 104,80; 162,80; 162,50; 164,90; 101,20; 357,20; 154,90 y 261,60 toneladas, hallar el rango simple. Solución: Dato máximo =

357,20

Dato mínimo = 101,20

R = 357,20 – 101,20 = 256,00 toneladas.

Resolver los siguientes ejercicios propuestos, utilizando Rango Simple de Variable Continua:

1) Si 7 tiendas venden el mismo producto a los siguientes precios: 12,20; 12,80; 13,00; 12,90; 13,50 y 13,10, hallar el rango simple.

Resp:

13,50;

1,30

2) Hallar el rango simple de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.

Resp: 30

3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el rango simple de remuneraciones? Resp: 2 550

z1 9 6 z


WA LT E R C É S P E D E S R A M Í R E Z

4) Hallar el rango simple de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322. Resp:

65

5) Hallar el rango simple de compras de: 118, 107, 115, 110 y 120. Resp:

13

6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar el rango simple. Resp:

296

7) Hallar el rango simple de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162. Resp:

82

8) Hallar el rango simple de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302. Resp:

131

4.2.2. Variación Cuartílica (Q) Se denomina también rango entre cuartiles o recorrido Inter cuartil, es una variación entre medidas porque es la diferencia entre los valores del tercer cuartil menos el valor del primer cuartil. Es una medida suplementaria de la mediana, abarcando un 50% de la distribución, dejando un 25 % para cada lado, esta medida de dispersión tiene las mismas limitaciones que la mediana y es utilizada mayormente en el cálculo de asimetría, que es una medida de forma que se verá en la siguiente unidad. La variación o desviación cuartílica se define de la siguiente manera: Q = Q3 – Q1 A pesar de tener una sola definición la variación cuartílica, en adelante se verá por separado este tipo de variación, porque los cuartiles tienen cálculo distinto, dependiendo como se presenten las observaciones.

z1 9 7 z


E S TA D Í S T I C A I

En algunas ocasiones, Estadística utiliza la variación cuartílica como Rango-semi-inter-cuartílico en el cálculo de kurtosis, que es otra medida de forma que se verá en la siguiente unidad. El Rango-semi-inter-cuartílico, se define de la siguiente manera: RQ = (Q3 – Q1) / 2

4.2.2.1. Variación Cuartílica para Datos no Agrupados Conociendo que tanto la ubicación como el valor del cuartil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos no agrupados.

Ejercicios resueltos

1) Hallar la variación cuartílica utilizando los siguientes datos no agrupados: 125, 536, 485, 789, 584, 725 y 649. Solución: Ordenando los datos en forma creciente donde N = 7: Posición Dato

1

2

3

4

5

6

7

125

485

536

584

649

725

789

Ubicación del cuartil 1:

Q1 = 1(N + 1) / 4 = 1(7 + 1) / 4 = 2

Q1 = es el dato de la posición 2 = 485 Ubicación del cuartil 3:

Q3 = 3(N + 1) / 4 = 3(7 + 1) / 4 = 6

Q3 = es el dato de la posición 6 = 725 Q = 725 – 485 = 240

2) Hallar la variación cuartílica utilizando los siguientes datos no agrupados: 37, 52, 67, 19, 33, 50, 62, 44, 58 y 61 Solución: Ordenando los datos en forma creciente donde N = 12:

Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

19

25

33

36

37

44

50

52

58

61

62

67

z1 9 8 z

25, 36,


WA LT E R C É S P E D E S R A M Í R E Z

Ubicación del cuartil 1:

Q1 = 1(N + 1) / 4 = 1(12 + 1) / 4 = 3,25

Interpolación del Q1 = 33 + 0,25(36 – 33) = 33,75 Ubicación del cuartil 3:

Q3 = 3(N + 1) / 4 = 3(12 + 1) / 4 = 9,75

Interpolación del Q3 = 58 + 0,75(61 – 58) = 60,25 Q = 60,25 – 33,75 = 26,5 3) Hallar la variación cuartílica utilizando los siguientes datos no agrupados: 56, 62, 74, 22, 71, 59, 33, 58, 63, 44, 38, 51, 68 y 61

Solución: Ordenando los datos en forma creciente donde N = 14: Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

22

33

38

44

51

56

58

59

61

62

63

68

71

74

Ubicación del cuartil 1:

Q1 = 1(N + 1) / 4 = 1(14 + 1) / 4 = 3,75

Interpolación del Q1 = 38 + 0,75(44 – 38) = 42,5 Ubicación del cuartil 3:

Q3 = 3(N + 1) / 4 = 3(14 + 1) / 4 = 11,25

Interpolación del Q3 = 63 + 0,25(68 – 63) = 64,25 Q = 64,25 – 42,5 = 21,75

Resolver los siguientes ejercicios propuestos, utilizando Variación Cuartílica para Datos no Agrupados:

1) Hallar la variación cuartílica utilizando los siguientes datos: 96, 105, 116, 88, 75, 110 y 127.

Resp:

28

2) Hallar la variación cuartílica utilizando los siguientes datos: 24, 26, 28, 31, 33, 24, 28, 27 y 22.

Resp:

5,5

3) Hallar la variación cuartílica utilizando los siguientes datos: 45, 77, 87.

Resp:

85, 74, 76, 58, 54, 62,

25

4) Hallar la variación cuartílica utilizando los siguientes datos: 287, 264, 168, 278, 218, 267 y 290.

Resp:

69

z1 9 9 z


E S TA D Í S T I C A I

5) Hallar la variación cuartílica utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 276 y 295.

Resp:

20

6) Hallar la variación cuartílica utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 571 y 1 562.

Resp:

29

7) Hallar la variación cuartílica utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.

Resp:

500

8) Hallar la variación cuartílica utilizando los siguientes datos: 30 522, 30 264, 30 870, 30 229, 30 618, 30 527, 30 281, 30 760 y 30 955.

Resp:

542,5

4.2.2.2. Variación Cuartílica para Datos Agrupados Conociendo que tanto la ubicación como el valor del cuartil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos agrupados.

Ejercicios resueltos

1) Hallar la variación cuartílica de la siguiente distribución de jornales por semana en soles: Jornales

455 465

465 475

475 485

485 495

495 505

505 515

515 525

35

40

30

18

12

10

5

455 465

465 475

475 485

485 495

495 505

505 515

515 525

fi

35

40

30

18

12

10

5

Fi

35

75

105

123

135

145

150

fi Solución: Jornales

Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63 Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17 Q

= 489,17 – 465,63 = 23,54 soles

z2 0 0 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar la variación cuartílica utilizando la siguiente distribución de estaturas en centímetros: Estat. 135 145 145 155 fi

15

155 165

165 175

45

65

25

175 185 185 195 195 205 25

20

5

Solución: Estat. 135 145 145 155 155 165 165 175 175 185

185 195 195 205

fi

15

25

45

65

25

20

5

Fi

15

40

85

150

175

195

200

Q1 = 155 + [(50 – 40) / 45] 10 = 157,22 Q3 = 165 + [(150 – 85) / 65] 10 = 175 Q

= 175 – 157,22 = 17,78 centímetros

Resolver los siguientes ejercicios propuestos utilizando Variación cuartílica:

1) Hallar la variación cuartílica utilizando las siguientes calificaciones: Calificación

02

fi

Resp:

05

05

6

08

08

12

11

11

32

14

14

30

17

17

16

20 4

4,84

2) Hallar la variación cuartílica utilizando las siguientes remuneraciones: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

685,71

3) Hallar la variación cuartílica utilizando las siguientes ventas: Ventas (miles) fi

Resp:

02

06 16

06

10

10

22

8,34

z2 0 1 z

14 62

14

18 40

18

22 36

22

26 24


E S TA D Í S T I C A I

4) Hallar la variación cuartílica utilizando las tallas de las siguientes personas: Personas fi

Resp:

55

65

75

85

95

105

115

125

24

26

28

28

26

30

26

12

36

5) Hallar la variación cuartílica utilizando las siguientes evaluaciones: Evaluación

02

fi

Resp:

05

05

16

08

08

18

11

11

32

14

14

36

17

17

12

20 6

5,67

6) Hallar la variación cuartílica utilizando los siguientes sueldos: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

715,35

7) Hallar la variación cuartílica utilizando las siguientes ventas: Ventas (miles)

12

fi

Resp:

16

16

20

20

20

24

24

24

26

28

28 32

20

16

32

36 14

10,33

8) Hallar la variación cuartílica utilizando las evaluaciones de los siguientes alumnos: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

42,97

9) Hallar la variación cuartílica utilizando las siguientes pensiones: Pensiones

800

fi 4 Resp: 107,42

850

900

950

1000

1050

1100

1150

16

36

40

26

19

5

4

z2 0 2 z


WA LT E R C É S P E D E S R A M Í R E Z

4.2.3. Variación Percentílica (P) Se denomina también rango entre percentiles o recorrido Inter percentil, es un tipo de variación o rango entre medidas, porque se obtiene mediante la diferencia entre el valor del percentil noventa menos el valor del percentil diez. Es una medida suplementaria de la mediana, abarcando un 80% de la distribución, dejando un 10 % para cada lado, esta medida de dispersión tiene las mismas limitaciones que la mediana y es utilizada mayormente en el cálculo de asimetría y kurtosist, que son medidas de forma que se verán en la siguiente unidad. La variación o desviación percentílica se define de la siguiente manera:

P = P90 – P10 A pesar de tener una sola definición la variación percentílica, en adelante se verá por separado este tipo de variación, porque los percentiles tienen cálculo distinto, dependiendo como se presenten las observaciones.

4.2.3.1. Variación Percentílica para Datos no Agrupados Conociendo que tanto la ubicación como el valor del percentil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos no agrupados.

Ejercicios resueltos 1) Hallar la variación percentílica utilizando los siguientes datos no agrupados: 1, 22, 15, 9, 13, 3, 15, 8, 14, 4, 13, 8, 15, 1, 16, 10 y 19

15, 6,

Ordenando los datos en forma creciente donde N = 19: Posición 1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

Dato

1

3

4

6

8

8

9

10

13

13

14

15

15

15

15

16

19

22

1

Ubicación del percentil 10:

P10 = 10(N + 1) / 100 = 10(19 + 1) / 100 = 2

P10 = es el dato de la posición 2 = 1 Ubicación del percentil 90:

P90 = 90(N + 1) / 100 = 90(19 + 1) / 100 = 18

P90 = es el dato de la posición 18 = 19

P = 19 – 1 = 18

z2 0 3 z


E S TA D Í S T I C A I

2) Hallar la variación percentílica utilizando los siguientes datos no agrupados: 77, 28, 71, 59, 35, 58, 63, 44, 38, 51, 68 y 61

58, 62,

Ordenando los datos en forma creciente donde N = 14: Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

28

35

38

44

51

58

58

59

61

62

63

68

71

77

Ubicación del percentil 10:

P10 = 10(N + 1) / 100 = 10(14 + 1) / 100 = 1,5

Interpolación del P10 = 28 + 0,5(35 – 28) = 31,5

Ubicación del percentil 90:

Interpolación del P90 = 71 + 0,5(77 – 71) = 74

P = 74 – 31,5 = 42,5

P90 = 90(N + 1) / 100 = 90(14 + 1) / 100 = 13,5

3) Hallar la variación percentílica utilizando los siguientes datos no agrupados: 27, 28, 21, 21, 31, 19, 13, 24, 28, 15, 18, 27, 26 y 31

38, 16,

Ordenando los datos en forma creciente donde N = 16: Posición Dato

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

13

15

16

18

19

21

21

24

26

27

27

28

28

31

31

38

Ubicación del percentil 10:

P10 = 10(N + 1) / 100 = 10(16 + 1) / 100 = 1,7

Interpolación del P10 = 13 + 0,7 (15 – 13) = 14,4

Ubicación del percentil 90:

Interpolación del P90 = 31 + 0,3(38 – 31) = 33,1

P = 90(N + 1) / 100 = 90(16 + 1) / 100 = 15,3

P = 33,1 – 14,4 = 18,7

Resolver los siguientes ejercicios propuestos, utilizando Variación Percentílica para Datos no Agrupados:

1) Hallar la variación percentílica utilizando los siguientes datos: 158, 162, 196, 105, 116, 188, 175, 110 y 127.

Resp:

91

2) Hallar la variación percentílica utilizando los siguientes datos: 34, 46, 38, 41, 33, 44, 38, 47 y 32.

Resp:

15

3) Hallar la variación percentílica utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87, 67.

Resp:

40,9

z2 0 4 z


WA LT E R C É S P E D E S R A M Í R E Z

4) Hallar la variación percentílica utilizando los siguientes datos: 152, 164, 187, 164, 168, 178, 181, 276, 295, 274 y 269.

Resp: 136,8

5) Hallar la variación percentílica utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 361, 355, 349 y 367.

Resp: 111,4

6) Hallar la variación percentílica utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 y 1 562.

Resp: 293,7

7) Hallar la variación percentílica utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.

Resp:

699,6

4.2.3.2. Variación Percentílica para Datos Agrupados Conociendo que tanto la ubicación como el valor del percentil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos agrupados.

Ejercicios resueltos

1) Hallar la variación percentílica de la siguiente distribución de jornales por semana en soles: Jornales

455 465

465 475

475 485

485 495

495 505

505 515

35

40

30

18

12

10

455 465

465 475

475 485

485 495

495 505

fi

35

40

30

18

12

10

5

Fi

35

75

105

123

135

145

150

fi

515 525 5

Solución: Jornales

P10 = 455 + [(15 – 0) / 35] 10 = 459,29 P90 = 495 + [(135 – 123) / 12] 10 = 505 P = 505 – 459,29 = 45,71 soles. z2 0 5 z

505 515

515 525


E S TA D Í S T I C A I

2) Hallar la variación percentílica utilizando la siguiente distribución de estaturas en centímetros: Estat.

135 145

145 155

155 165

165 175

15

25

45

65

25

165 175

175 185

fi

175 185

185 195

195 205

20

5

Solución: Estat.

135 145

145 155

155 165

185 195

195 205

fi

15

25

45

65

25

20

5

Fi

15

40

85

150

175

195

200

P10 = 145 + [(20 – 15) / 25] 10 = 147 P90 = 185 + [(180 – 175) / 20] 10 = 187,5

P

= 187,5 – 147 = 40,5 centímetros

Resolver los siguientes ejercicios propuestos utilizando Variación Percentílica:

1) Hallar la variación percentílica utilizando las siguientes calificaciones: Calificación

02

fi

Resp:

05

05

6

08

08

12

11

11

32

14

14

30

17

17

16

20 4

9,88

2) Hallar la variación percentílica utilizando las siguientes remuneraciones: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

1 419,05

3) Hallar la variación percentílica utilizando las siguientes ventas: Ventas (miles) fi

Resp:

02

06 16

06

10

10

22

15,94

z2 0 6 z

14 62

14

18 40

18

22 36

22

26 24


WA LT E R C É S P E D E S R A M Í R E Z

4) Hallar la variación percentílica utilizando las tallas de las siguientes personas: Personas fi

Resp:

55

65

75

85

95

105

115

125

24

26

28

28

26

30

26

12

58,59

5) Hallar la variación percentílica utilizando las siguientes evaluaciones: Evaluación

02

fi

Resp:

05

05

16

08

08

18

11

11

32

14

14

36

17

17

12

20 6

11,25

6) Hallar la variación percentílica utilizando los siguientes sueldos: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

1 400

7) Hallar la variación percentílica utilizando las siguientes ventas: Ventas (miles)

12

fi

Resp:

16

16

20

20

20

24

24

24

26

28 20

28 32 16

32

36 14

18,17

8) Hallar la variación percentílica utilizando las evaluaciones de los siguientes alumnos: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

79,93

9) Hallar la variación percentílica utilizando las siguientes pensiones: Pensiones

800

850

900

950

1000

1050

fi 4 16 36 40 26 19 Resp: 199,83

z2 0 7 z

1100

1150

5

4



L e c c i ó n

3

4.3. MEDIDAS DE DISPERSIÓN RELATIVAS

Son parámetros que miden la dispersión en términos relativos, un porcentaje o una proporción, de modo que permiten una sencilla comparación entre la dispersión de distintas distribuciones. Dependiendo que se desee comparar en términos relativos la variabilidad de un conjunto de observaciones o datos, existen diferentes tipos de dispersión relativa, algunos comparan una medida de dispersión absoluta con una medida de posición, otras comparan el rango entre dos mediada de dispersión, finalmente otras comparan simplemente la relatividad entre dos observaciones, que generalmente son extremas. Entre las medidas de dispersión relativa, se presentan a continuación las mayormente utilizadas en estadística, que son:

4.3.1. Coeficiente de Variación (C.V.) Karl Pearson (1857-1936) desarrolló una medida relativa denominada coeficiente de variación que es útil cuando: 1º Los datos o distribuciones a comprar, están en unidades diferentes. 2º Los datos o distribuciones a comprar, están en la mismas unidades, pero las medias aritméticas muy distantes.

z2 0 9 z


E S TA D Í S T I C A I

Su principal inconveniente es que en el caso de distribuciones cuya media se acerca a cero, su valor tiende a infinito e incluso resulta imposible de calcular cuando la media es cero. Por ello no puede usarse, para variables tipificadas El coeficiente de variación, representa el número de veces que la desviación típica contiene a la media aritmética, y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media. Como la desviación estándar o típica es inferior a la media, suele expresarse este coeficiente en tanto por ciento, para facilitar su comprensión. Realmente el coeficiente de variación es la desviación estándar expresada como porcentaje de la media aritmética. El coeficiente de variación, se define de la siguiente manera:

Donde: S = Desviación estándar o típica

X =

Media aritmética

Ejercicios resueltos 1) Hallar el coeficiente de variación utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:

z2 1 0 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar el coeficiente de variación utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44.

Solución:

C. V. = (7,43 / 50) 100 = 14,86% 3) Hallar el coeficiente de variación utilizando los siguientes datos agrupados:

Compras fi

25 35

35 45

45 55

55 65

65 75

75 85

85 95

95 105

16

24

25

40

35

30

20

10

Solución:

C. V. = (19,14 / 63,70) 100 = 30,05%

z2 1 1 z


E S TA D Í S T I C A I

4) Hallar el coeficiente de variación utilizando los siguientes datos agrupados:

Consultas

251 259

260 268

2

12

fi

269

277

10

278 286

287 295

296 304

305 313

10

6

6

4

Solución:

Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de variación para Datos no Agrupados:

1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar el coeficiente de variación: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.}

Resp:

3,15%

2) Hallar el coeficiente de variación de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.

Resp:

13,88%

3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el coeficiente de variación de las remuneraciones?

Resp:

3,02%

z2 1 2 z


WA LT E R C É S P E D E S R A M Í R E Z

4) Hallar el coeficiente de variación de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.

Resp:

5,94%

Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Variación para Datos Agrupados:

1) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 15 18 26 36 20 10 Resp: 9,27%

2) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 11 25 40 65 37 14 8 Resp: 15,98%

3) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

14 30 48 54 34 20 fi Resp: 19,34%

4) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

4 16 25 18 12 5 fi Resp: 32,50%

z2 1 3 z


E S TA D Í S T I C A I

4.3.2. Variable Estándar (Z) La variable estándar es conocida también como variable tipificada o estandarizada, es una medida estadística de dispersión relativa, que se utiliza para comparar la posición de una variable de un conjunto de datos, con otra variable de otro conjunto de datos; la variable que tenga mayor posición estándar, será mejor que la otra. La variable estándar determina dentro de los límites de cada conjunto de datos, que variable es mejor al ser comparadas. Su mayor importancia está cuando por ejemplo se compara el sueldo de dos trabajadores de ciudades distintas. La variable estándar o típica, se define de la siguiente manera:

Donde:

S

X

X1

= Desviación estándar o típica.

= Media aritmética. = Variable

Ejercicios resueltos

1) En la ciudad de Iquitos, el promedio de remuneraciones es de 1 054 soles con una desviación estándar de 132; en cambio en la ciudad de Lima, el promedio es de 1 196 soles con una desviación estándar de 145. Si un trabajador de Iquitos gana 1 200 soles y otro trabajador de Lima gana 1 300 soles, ¿quién vive mejor en cada una de sus ciudades? Solución: Iquitos

:

Xi = 1 200

= 1 054

S = 132

ZIquitos =

?

Lima

:

Xi = 1 300

= 1 196

S = 145

ZLima

?

ZIquitos = (1 200 – 1 054) / 132 = 1,11 Respuesta:

=

ZLima = (1 300 – 1 196) / 1145 = 0,72

Vive mejor el trabajador de Iquitos

z2 1 4 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Compare a los trabajadores de ambas fábricas y determine quién tiene mejor posición: Fábrica

Sueldo de un trabajador

Promedio

Desviación estándar

A

960,50

920,40

105,15

B

960,50

920,40

102,82

Solución: A :

Xi

=

960,50

= 920,40

S = 105,15

ZA =

B :

Xi

=

960,50

= 920,40

S = 103,82

ZB

ZA = (960,50 – 920,40) / 105,15 = 0,38 Respuesta: presa.

=

? ?

ZB = (960,50 – 920,40) / 103,82 = 0,39

el trabajador de B está ligeramente mejor que el A, dentro de su em-

4.3.3. Coeficiente de Desviación Mediana (C.D.Me.) El coeficiente de desviación mediana, representa el número de veces que la desviación mediana contiene a la mediana, y por lo tanto cuanto mayor es coeficiente de desviación mediana, mayor es la dispersión y menor la representatividad de la mediana. Como la desviación mediana es inferior a la mediana, suele expresarse este coeficiente en tanto por ciento, para facilitar su comprensión. Realmente el coeficiente de desviación mediana, es la desviación mediana expresada como porcentaje de la mediana, y es útil en los casos en que la mediana tiene mayor representatividad que la media aritmética. El coeficiente de desviación mediana, se define de la siguiente manera:

Donde:

DM

= Desviación mediana.

Me

= Mediana.

z2 1 5 z


E S TA D Í S T I C A I

Ejercicios resueltos

1) Hallar el coeficiente de desviación mediana utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.

Solución: Ordenando los datos en forma creciente, se tiene:

Posición

1

2

3

4

5

6

7

8

9

10

11

257

264

319

347

388

424

425

485

496

528

533

167

160

105

77

36

0

1

61

72

104

109

Total (Σ) 892

Posición de la Me = (N + 1 ) / 2 = (11+1) / 2 = 6 Me, es el dato de la posición 6: 424

C.D.Me = (81,09 / 424) 100 = 19,13%

2) Hallar el coeficiente de desviación mediana utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44.

Solución: Ordenando los datos en forma creciente, se tiene:

Posición

1

2

3

4

5

6

7

8

9

10

Total

38

44

45

46

47

48

53

57

58

64

(Σ)

9,5

3,5

2,5

1,5

0,5

0,5

5,5

9,5

10,5

16,5

60

Posición de la Me = (N + 1 ) / 2 = (10+1) / 2 = 5,5

z2 1 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Me = 47 + 0,5(48 – 47) = 47,5

C.D.Me = (6 / 47,5) 100 = 12,63%

3) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados:

Rem.

600 1000 1000 1400 1400 1800 1800 2200

fi

21

58

65

28

2200 2600

2600 3000

16

12

Solución:

Remuneraciones

fi

Fi

Xi

f

600

1 000

21

21

800

729,23

15 313,83

1 000

1 400

58

79

1 200

329,23

19 095,34

1 400

1 800

65

144

1 600

70,77

4 600,05

1 800

2 200

28

172

2 000

470,77

13 181,56

2 200

2 600

16

188

2 400

870,77

13 932,32

2 600

3 000

12

200

2 800

1 270,77

15 249,24

Σ

200

81 372,34

Posición de la mediana: N / 2 = 200 / 2 = 100 Li = 1 400;

N = 200;

fi = 65;

Fi – 1 = 79;

C.D.Me = (406,86 / 1529,23) 100 = 26,61%

z2 1 7 z

e = 1 800 – 1 400 = 400


E S TA D Í S T I C A I

Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Desviación Mediana para Datos no Agrupados:

1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar el coeficiente de desviación mediana por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.

Resp:

2,38%

2) Hallar el coeficiente de desviación mediana de los siguientes jornales: 65, 58, 67, 72, 75, 85, 60 y 55.

Resp:

11,56%

3) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el coeficiente de desviación mediana?

Resp:

2,46%

4) Hallar el coeficiente de desviación mediana de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 323.

Resp:

4,60%

5) Hallar el coeficiente de desviación mediana de las siguientes compras: 118, 107, 115, 110 y 120.

Resp:

3,65%.

Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Desviación Mediana para Datos Agrupados:

1) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 7,45% 2) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 12,15% 3) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: z2 1 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Sueldos

800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

20

30

48

54

34

14

fi

Resp: 16,47% 4) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Pedidos

1000 2000

2000 3000

3000 4000

4000 5000

5000 6000

6000 7000

6

16

25

18

10

5

fi

Resp: 28,25% 5) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Pesos (Kg)

40 50

50 60

60 70

70 80

80 90

90 100

100 110

fi 10 25 55 45 38 22 5 Resp: 16,45%

4.3.4. Coeficiente de Apertura (C.A.) Es el cociente entre los valores extremos de la distribución de datos o conjunto de dato, se usa para comparar el número de veces que el valor máximo contiene al valor mínimo. Realmente el coeficiente de apertura, es el máximo valor expresado en términos del mínimo valor, y es útil en los casos en los que se comparen por ejemplo sueldos. El coeficiente de apertura, se define de la siguiente manera:

C. A. = Dato máximo / Dato mínimo

Ejercicios resueltos

1) Hallar el coeficiente de apertura utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución: Dato máximo = 533

Dato mínimo = 257

C. A. = 533 / 257 = 2,07 veces.

z2 1 9 z


E S TA D Í S T I C A I

2) Hallar el coeficiente de apertura utilizando los siguientes datos agrupados: Pesos (Kg) fi

40 50

50 60

60 70

70 80

80 90

90 100

100 110

10

25

55

45

38

22

5

Solución: Dato máximo = 110

Dato mínimo = 40

C. A. = 110 / 40 = 2,75 veces. Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Apertura:

1) Hallar el coeficiente de desviación mediana de los siguientes jornales: 65, 58, 67, 72, 75, 85, 60 y 55.

Resp:

1,55 veces

2) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el coeficiente de desviación mediana?

Resp:

1,09 veces

3) Hallar el coeficiente de desviación mediana de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 323.

Resp:

1,22 veces

4) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Estaturas

125 135

135 145

145 155

155 165

165 175

175 185

fi 10 18 26 36 20 15 Resp: 1,48 veces 5) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Jornales

55 65

65 75

75 85

85 95

95 105

105 115

115 125

fi 8 25 40 65 37 14 11 Resp: 2,27 veces 6) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Sueldos 800 1000

1000 1200

1200 1400

1400 1600

1600 1800

1800 2000

20 30 48 54 34 14 fi Resp: 2,50 veces. z2 2 0 z


WA LT E R C É S P E D E S R A M Í R E Z

4.3.5. Recorrido Relativo (R.R.) El recorrido relativo, representa el número de veces que el recorrido de la variable o rango contiene a la media aritmética, y por lo tanto cuanto mayor es R. R. mayor es la dispersión y menor la representatividad de la media. Generalmente como el recorrido de la variable es inferior a la media, suele expresarse este coeficiente en porcentaje, para facilitar su comprensión. El recorrido relativo, se define de la siguiente manera:

Donde:

R = Rango simple o recorrido de la variable

X=

Media aritmética

Ejercicios resueltos 1) Hallar el recorrido relativo utilizando los siguientes datos discretos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:

R = 533 – 257 + 1 = 277 R. R. = (277 / 406) = 68,23% 2) Hallar el recorrido relativo utilizando las siguientes calificaciones:

Calif. fi

260 280 280 300 300 320 3

15

320 340 340 360 360 380 380 400

20

25

z2 2 1 z

12

8

7


E S TA D Í S T I C A I

Solución: Calificaciones

fi

Xi

fi Xi

260

280

3

270

810

280

300

15

290

4 350

300

320

30

310

9 300

320

340

25

330

8 250

340

360

12

350

4 200

360

380

8

370

2 960

380

400

7

390

2 730

Σ

100

32 600

R = 400 – 260 = 140 R. R. = (140 / 326) = 42,94%

4.3.6. Recorrido Inter-Cuartílico Relativo (RQ.R.) Representa el número de veces que la desviación cuartílica contiene a la mediana o cuartil 2, el recorrido inter-cuartílico relativo, es la desviación cuartílica expresada como porcentaje de la mediana, y es útil solo en los casos en que la mediana tiene mayor representatividad que la media aritmética. El RQ.R se define de la siguiente manera:

Donde: Q3 – Q1 = Desviación cuartílica

Me

= Mediana = Q2

z2 2 2 z


WA LT E R C É S P E D E S R A M Í R E Z

4.3.7. Recorrido Semi-Inter-Cuartílico Relativo (RS.I.R.) Representa el número de veces que la desviación cuartílica contiene a la suma entre cuartiles 1 y 3, el recorrido semi-inter-cuartílico relativo, es prácticamente medio recorrido inter-cuartílico relativo. Este coeficiente tiene poco uso. El RS.I.R se define de la siguiente manera:

Donde: Q3 – Q1 = Desviación cuartílica. Q3 + Q1 = Equivale a 2 Q2.

Estas medidas por ser poco usadas, solo se presentan para el conocimiento del alumno.

z2 2 3 z



L e c c i ó n

4

4.4. PROPIEDADES DE LAS MEDIDAS DE DISPERSIÓN Las medidas de dispersión llamadas también medidas de variabilidad, son medidas de resumen por que representan generalmente de alguna manera la variación de todos los datos, tienen un comportamiento distinto ante los cambios de origen y ante los cambios de escala.

4.4.1 Cambio de origen Si a los valores que toma una variable X (recorrido de la variable) se le suma o se le resta un determinado número, la variable original no cambia de origen, esto acurre solo con las medidas de dispersión de tipo absoluta, pero las medidas relativas si se ven afectadas, por que utilizan como valor relativo o como denominador una medida de posición. Si a la Variable Xa se le resta o adiciona “k”, resulta: Xb = Xa ± k Entonces:

D (Xb)

=

D (Xa)

DM (Xb)

=

Me (Xa)

S2

(Xb)

=

S2 (Xa)

S

(Xb)

=

S

(Xa)

R

(Xb)

=

R

(Xa)

C.V. (Sa / a)

=

C.V. [Sb / (b ± k)]

z2 2 5 z


E S TA D Í S T I C A I

Ejercicio de comprobación:

4.4.2. Cambio de escala Si a los valores que toma una variable X (recorrido de la variable) se le multiplica o divide por un determinado número, se produce un cambio de escala en la variable original, esto acurre solo con las medidas de dispersión de tipo absoluta, en cambio las medidas de dispersión relativas no se ven afectadas, por que utilizan como valor relativo o como denominador una medida de posición afectada por el mismo valor. Si a la Variable Xa se le multiplica “k”, resulta: Xb = k Xa. Entonces:

D (Xb)

=

k D (Xa)

DM (Xb)

=

k Me (Xa)

S2

(Xb)

=

k2 S2 (Xa)

S

(Xb)

=

k S

(Xa)

R

(Xb)

=

k R

(Xa)

C.V. (Sb / b)

=

C.V. (Sa / a)

También, Si a la Variable Xa se le divide entre “k”, resulta: Xb = Xa / k.

z2 2 6 z


Entonces:

D (Xb)

=

D (Xa) / k

DM (Xb)

=

Me (Xa) / k

S2

(Xb)

=

S2 (Xa) / k2

S

(Xb)

=

S

(Xa) / k

R

(Xb)

=

R

(Xa) / k

C.V. (Sb / b) =

C.V. (Sa / a)

Ejercicio de comprobaciรณn

La diferencia entre los coeficientes de variaciรณn, se deben solo al redondeo de datos.

z2 2 7 z


E S TA D Í S T I C A I

AUTOEVALUACIÓN Nº 4 1) Hallar la desviación media de las siguientes inasistencias: 13, 12, 15, 9, 15, 6, y 14. A) 2,57

B) 3,08

C) 2,92

D) 2,73

E) 2,16

2) Hallar la desviación media de las siguientes remuneraciones: Remun.

600 700 700 800 800 900 900 1000

fi

13

A) 154,22

15

B) 129,49

20

25

C) 133,33

1000 1100

1100 1200

15

12

D) 141,50

E) 130,00

3) Hallar la desviación mediana de las siguientes edades: 22, 19, 17, 19, 25, 36, y 34.

A) 7,16

B) 6,21

C) 4,59

D) 5,71

E) 8,27

4) Hallar la desviación mediana utilizando los siguientes datos agrupados: Util.

1000 1500

1500 2000

2000 2500

2500 3000

3000 3500

3500 4000

15

30

55

55

30

15

fi A) 420

B) 550

C) 945

D) 725

E) 651

5) Hallar la varianza de las siguientes remuneraciones: Remun. 600 700 700 800 800 900 fi A) 25 418 u2

13

15 B) 30 084 u2

900 1000

1000 1100

1100 1200

25

15

12

20 C) 23 500 u2

D) 22 731 u2

E) 21 647 u2

6) Hallar la varianza de las siguientes calificaciones: 785, 569, 784, 650, 488, 695, 567 y 782 A) 9 627,50 u2

B) 10 583,37 u2

C) 11 690,50 u2

z2 2 8 z

D) 7 258,54 u2

E) 15 124,00 u2


WA LT E R C É S P E D E S R A M Í R E Z

7) Hallar la desviación estándar de las siguientes remuneraciones: Remun.

600 700 700 800 800 900 900 1000 1000 1100

fi

8

A) 146,54

20

30

B) 125,84

15

15

C) 112,85

D) 202,02

1100 1200 12 E) 164,74

8) Hallar la desviación estándar de las siguientes ventas en miles: 28,5; 16,9; 28,4; 15,0; 18,8; 19,5; 16,7 y 18,2 A) 6,27

B) 3,36

C) 5,87

D) 7,54

E) 4,91

9) Hallar el rango simple de las siguientes intervenciones en clase: 8, 2, 9, 4, 2, 7, 6, 10, 11, 6, 5, 4, 14, 6 y 8 A) 9

B) 13

C) 11

D) 10

E) 12

10) Hallar el coeficiente de variación de las siguientes remuneraciones: Remun. 900 fi A) 25,18%

10

1 200

1 500

1 800

2 100

2 400

2 700

22

40

45

15

10

8

B) 22,15%

C) 24,58%

D) 26,12%

E) 21,47%

11) Determine la variable estándar de ambos trabajadores, con los siguientes datos: Fábrica

Sueldo de un trabajador

Promedio

Desviación estándar

A

1 325,50

1 020,20

205,18

B

1 421,00

1 325,40

202,24

A) ZA 1,19 y ZB 0,47 D) ZA 1,49 y ZB 0,47

B) ZA 1,49 y ZB 1,47

E) ZA 1,49 y ZB 2,47

z2 2 9 z

C) ZA 1,42 y ZB 0,44


E S TA D Ă? S T I C A I

12) Hallar el coeficiente de desviaciĂłn mediana utilizando los siguientes datos agrupados: Ventas (en millones)

2

fi

6 16

A) 42,05%

6 10

10 14

14 18

18 22

22 26

22

62

40

36

24

B) 34,00%

C) 19,45%

D) 37,25%

E) 46,51%

13) Hallar el coeficiente de apertura utilizando los siguientes datos: 96, 48, 57, 88, 52, 26, 47, 42, 33, 19 y 42. A) 5,05 veces

B) 7,22 veces

C) 9,45 veces

D) 5,87 veces

E) 6,33 veces

14) Hallar el recorrido relativo utilizando las siguientes calificaciones: Remun. 600 700 700 800 800 900 900 1000 fi

13

A) 54,18%

15

20

B) 84,65%

1000 1100

1100 1200

15

12

25 C) 48,47%

D) 66,67%

E) 61,64%

15) Hallar el recorrido inter-cuartĂ­lico relativo de las siguientes ventas en miles: Ventas (miles) fi

02

06

06

16

A) 52,37%

B) 44,19%

10 22

10

14

14

62 C) 59,57%

18 40

18

22 36

D) 52,33%

22

26 24 E) 21,32%

Respuestas de control 1. A, 2. E, 3.D, 4. B, 5. C, 6. C, 7. A, 8. E, 9. B, 10. D, 11. D, 12. B, 13. A, 14. D, 15. C

z2 3 0 z


WA LT E R C É S P E D E S R A M Í R E Z

GLOSARIO

Función Derivable.

Es una función matemática que utiliza derivadas para darle un tratamiento de una función continua (variable continua).

Función no Derivable.

Es una función matemática a la cual se le da un tratamiento discreto, no utiliza derivadas.

Homogeneidad.

Se refiere a los datos u observaciones en su conjunto, que son iguales o bastante similares entre sí.

Heterogeneidad.

Se refiere a los datos u observaciones en su conjunto, que son muy diferentes o bastante dispersos entre sí.

Medida Absoluta.

Es el valor obtenido por el uso de una fórmula o definición de una medida estadística.

Medida Relativa.

Es el valor obtenido al comparar por cociente dos valores absolutos o dos medidas absolutas.

Valor Absoluto.

Es el valor resultante de una operación matemática al cual no se le considera signo.

Valor Representativo.

Es el valor que expresa el contenido todo un conjunto de datos. Ejemplo, el promedio de notas de un conjunto homogéneo.

Variable Tipificada.

Es la conversión de una variable es términos estandarizados; es decir, convertir un valor “X” en una Variable Típica o Estándar (Z).

EXPLORACIÓN ON LINE http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n http://www.vitutor.net/2/11/medidas_dispersion.html http://html.rincondelvago.com/medidas-de-dispersion.html http://www.tuveras.com/estadistica/estadistica02.htm z2 3 1 z



q u i n t a

UNIDAD Medidas de Concentración

Momentos: Momentos con relación al origen, Momentos con relación a la media aritmética Asimetría: Tipos de Asimetría, Cálculo según definición Curtosis: Tipos de Curtosis, Cálculo según definición Desigualdad: Índice de Gini: definición y cálculo, Curva de Lorenz: definición y gráfico


OBJETIVO (S) GENERAL Aprender que además de las medidas de tendencia central y las medidas de dispersión, en la Estadística se utilizan también las medidas de concentración tanto de forma como de desigualdad. Las medidas de forma llamadas asimetría, que sirven para determinar la forma cómo se presentan los datos hacia los lados; es decir, para saber si la concentración de los datos están: hacia la derecha, hacia el centro o hacia la izquierda; de la media aritmética. También existe otra medida de forma hacia arriba llamada curtosis, que nos dice con qué intensidad los datos se encuentran repetidos en su conjunto; de manera: alta, media o baja. Encontrar con el índice de Gini y con la curva de Lorenz, la manera en que se encuentran repartidos los datos y con qué frecuencia, la relación variable y frecuencia pone de relieve el mayor o menor grado de desigualdad en el reparto de la variable en cada clase, son por tanto indicadores del grado de distribución de la variable; estos indicadores son las medidas de desigualdad . ESPECÍFICOS • Conocer mediante los momentos cuáles son sus aplicaciones dentro de las medidas de forma, además de saber identificarlos y utilizarlos. • Saber cómo son los datos en su conjunto, conocer si tienen forma simétrica o asimétrica. • Saber cómo son los datos en su conjunto, conocer si tienen forma de gran apuntamiento o no. • Determinar cómo se distribuyen los datos con relación a la variable que se investiga, saber si es equitativa o no.


L e c c i ó n

1

5.1. MOMENTOS Entre los parámetros o medidas estadísticas más utilizadas en una investigación, están la media aritmética y la varianza, por que expresan un promedio y una variabilidad estandarizada; por ello, los momentos han sido definidos considerando estas dos importantes medidas. Existen dos tipos de momentos, unos basados en la definición de la media, por ello se dice son momentos con relación al origen; otros momentos se basan en la definición de la varianza, por ello se dice que son momentos con relación a la media aritmética. La característica principal de todo momento, es que se encuentran definidos en grado “r”, donde dicho grado puede tomar cualquier valor entero, aunque los grados que se pueden utilizar en la Estadística Descriptiva, son de 1 al 4: r: 1, 2, 3

y4

Por ser obtenidas estas medidas estadísticas de un conjunto de datos, es necesario definir un procedimiento apropiado para obtenerlas, según como se encuentren dichos dato; por lo tanto, se definirá un procedimiento de cálculo cuando los datos están dispersos o no agrupados, y otro procedimiento para las distribuciones de frecuencias o simplemente datos agrupados.

5.1.1. Momentos con relación al origen (Mr) La definición de tales momentos basados en la definición de la media aritmética, como ya se ha mencionado va a depender del estado en que se encuentran los datos, que son dispersos o no agrupados, y las distribuciones de frecuencias o simplemente datos agrupados. z2 3 5 z


E S TA D Í S T I C A I

5.1.1.1. Momentos para Datos No Agrupados Cuando la información está desordenada o simplemente hay un grupo de datos (Xi) representados uno por uno que pueden o no estar repetidos, el momento de orden “r” con relación al origen de N datos se define de la siguiente manera:

Considerando que los valores de “r” dentro de esta definición, van del 1 al 4, los momentos para cada orden son:

Ejercicios resueltos 1) Hallar los momentos del 1 al 4, con relación al origen de: Solución: Variable

X1

X2

X3

X1

14

196

2 744

38 416

X2

18

324

5 832

104 976

X3

20

400

8 000

160 000

X4

13

169

2 197

28 561

X5

11

121

1 331

14 641

X6

14

196

2 744

38 416

Σ (Total)

90

1 406

22 848 z2 3 6 z

X4

385 010

14, 18, 20, 13, 11 y 14


WA LT E R C É S P E D E S R A M Í R E Z

M1 = 90 / 6 = 15 u

M2 = 1 406 / 6 = 234,33 u2

M3 = 22 848 / 6 = 3 808 u3

M4 = 385 010 / 6 = 64 168,33 u4

2) Hallar los momentos, con relación al origen de: 560, 660, 900, 930, 810, 880, 760 y 900 Solución: Soles

X1

X2

X3

X1

560

313 600

175 616 000

9,834496x1010

X2

660

435 600

287 496 000

18,974736x1010

X3

900

810 000

729 000 000

65,610000x1010

X4

930

864 900

804 357 000

74,805201x1010

X5

810

656 100

531 441 000

43,046721x1010

X6

880

774 400

681 472 000

59,969536x1010

X7

760

577 600

438 976 000

33,362176x1010

X8

900

810 000

729 000 000

65,610000x1010

Σ (Total)

6400

5 242 200

X4

4 377 358 000

371,212866 x1010

Cuando los números son muy grandes es preferible expresarlos en forma científica (x10k). M1 = 6400 / 8 = 800 u M2 = 5 242 200 / 8 = 655 275 u2 M3 = 4 377 358 000 / 8 = 547 169 750 u3 M4 = 371,212866x1010 / 8 = 46,40160825x1010 u4 Donde “u” representa la unidad de la variable (Soles). Resolver los siguientes ejercicios propuestos con datos no agrupados, utilizando Momentos con relación al origen: 1) Hallar los momentos del 1 al 4, con relación al origen de: 458, y 500 toneladas. Resp:

87 340 044,86 u3,

4,454336 x1010 u4.

2) Hallar los momentos del 1 al 4, con relación al origen de: 38, 55, 65 y 41 asistentes.

45, 81, 72, 56, 53, 54,

Resp:

408 u,

56 u,

181 806,86 u2,

425, 625, 253, 280, 315,

3 300,6 u2,

204 256,4 u3, z2 3 7 z

13 216 138,2 u4.


E S TA D Í S T I C A I

3) Hallar los momentos del 1 al 4, con relación al origen de: 157, 185, 164, 155, 187, 154, 188, 124, 152 y 144 soles. Resp:

161 u,

26 304 u2,

4 357 689,2 u3,

731 419 510,8 u4.

4) Hallar los momentos del 1 al 4, con relación al origen de: 1 485, 1 457, 1 288, 1 557 y 1 243 participantes Resp:

1 406 u,

1 991 263,2 u2,

2 839 904 318 u3,

407,7152 x1010 u4.

5) Hallar los momentos del 1 al 4, con relación al origen de: 56, 64, 72, 53, 45, 38, 44 y 52 empresas. Resp:

53 u,

2 916,75 u2,

166 459,25 u3,

9 827 690,25 u4.

6) Hallar los momentos del 1 al 4, con relación al origen de: 85, 88, 86, 87, 89, 88, 83, 87 y 90 universitarios. Resp:

87 u,

7 573 u2,

659 543 u3,

57 470 066,33 u4.

7) Hallar los momentos del 1 al 4, con relación al origen de: 250, 257, 250, 255 y 254 soles. Resp:

258 u,

66 617,6 u2,

252, 257, 265, 268, 272,

17 215 273,8 u3,

4 452 463 355,6 u4.

8) Hallar los momentos del 1 al 4, con relación al origen de: 13, 18 y 16 puntos. Resp:

13 u,

180 u2,

2 614 u3,

15, 16, 9, 14, 10, 12, 7, 39 334,8 u4.

9) Hallar los momentos del 1 al 4, con relación al origen de: 880, 760 y 800 litros. Resp:

790 u,

627 625 u2,

501 410 500 u3,

10) Hallar los momentos del 1 al 4, con relación al origen de: 860 y 2 900 unidades. Resp:

2800 u,

7 851 520 u2,

760, 860, 700, 830, 730, 40,277658 x1010 u4. 2 680, 2 660, 2 900, 2

2,204832 x 1010 u3,

6,200261 x1010 u4

5.1.1.2. Momentos para Distribuciones de Frecuencias Cuando la información está ordenada en tablas de distribución de frecuencias, donde la frecuencia absoluta (fi) representa la repetición de la marca de clase (Xi), el momento de orden “r” con relación al origen de N datos se define de la siguiente manera:

z2 3 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Considerando que los valores de “r” van del 1 al 4, los momentos para cada orden son:

A pesar de que el momento del orden 2 con relación al origen no tiene uso en el presente texto, es posible darle uso a este momento, si en el cálculo de la Varianza, se utiliza la fórmula desarrollada del binomio al cuadrado, que concluye de la siguiente manera:

Como habrá observado, la primera parte de la fórmula de la Varianza, es el momento del orden 2 y la segunda parte es el momento del orden 1 al cuadrado, ambos con relación al origen.

Ejercicios resueltos

1) Hallar los momentos del 1 al 4, con relación al origen utilizando la siguiente distribución de jornales por semana en soles: Jornales fi

455 465 465 475 475 485 485 495 495 505 505 515 515 525 35

40

30

18

z2 3 9 z

12

10

5


E S TA D Í S T I C A I

Solución: Jornales

fi

455

465

35

465

475

475

Xi

fi Xi2

fi Xi3

fi Xi4

460 16 100

7 406 000

3 406 760 000

15,6710960 x 1011

40

470 18 800

8 836 000

4 152 920 000

19,5187240 x 1011

485

30

480 14 400

6 912 000

3 317 760 000

15,9252480 x 1011

485

495

18

490

8 820

4 321 800

2 117 682 000

10,3766418 x 1011

495

505

12

500

6 000

3 000 000

1 500 000 000

7,5000000 x 1011

505

515

10

510

5 100

2 601 000

1 326 510 000

6,7652010 x 1011

515

525

5 520

2 600

1 352 000

703 040 000

3,6558080 x 1011

71 820 34 428 800

16 524 672 000

79,4127188 x 1011

150

Σ (Total)

fi Xi

M1 = 71 820 / 150 = 478,8 u M2 = 34 428 800 / 150 = 229 525,33 u2 M3 = 16 524 672 000 / 150 = 110 154 480 u3 M4 = 79,4127188 x1011 / 150 = 5,29418125 x 1010 u4

2) Hallar los momentos del 1 al 4, con relación al origen de las siguientes estaturas en metros: Estat. 1,35 1,45 1,45 1,55 fi

16

25

1,55 1,65

1,65 1,75 1,75 1,85 1,85 1,95 1,95 2,05

45

65

24

20

Solución:

Estaturas

fi

Xi

fi Xi

fi Xi2

fi Xi3

fi Xi4

1,35

1,45

16

1,4

22,40

31,36

43,904

61,4656

1,45

1,55

25

1,5

37,50

56,25

84,375

126,5625

1,55

1,65

45

1,6

72,00

115,20

184,320

294,9120

1,65

1,75

65

1,7

110,50

187,85

319,345

542,8865

1,75

1,85

24

1,8

43,20

77,76

139,968

251,9424

1,85

1,95

20

1,9

38,00

72,20

137,180

260,6420

1,95

2,05

5

2,0

Σ (Total)

200

10,00

20,00

40,000

80,0000

333,60

560,62

949,092

1 618,4110

z2 4 0 z

5


WA LT E R C É S P E D E S R A M Í R E Z

M1 = 333,6 / 200 = 1,668 u

M2 = 560,62 / 200 = 2,8031 u2

M3 = 949,092 / 200 = 4,745 u3 M4 = 1 618,411 / 200 = 8,0921 u4 Resolver los siguientes ejercicios propuestos con datos agrupados o distribuciones de frecuencias, utilizando Momentos con relación al origen: 1) Hallar los momentos del 1 al 4, con relación al origen de: Calificación

02

fi Resp:

05

05

6 11 u

08

08

12

11

11

32

133,69 u2

14

14

30

17

17

16

1 744,91 u3

20 4

24 074,46 u4

2) Hallar los momentos del 1 al 4, con relación al origen de: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi Resp : 1596 u

2 832 000 u2

5,53728 x 109 u3

117,90336 x 1011 u4

3) Hallar los momentos del 1 al 4, con relación al origen de: Ventas (miles)

02

fi

06

06

16

Resp: 14,6 u

10

10

22

14

14

62

245,28 u2

18

18

40

22

22

36

4 515,2 u3

24

88 619,52 u4

4) Hallar los momentos del 1 al 4, con relación al origen de: Personas

55

65

75

85

95

105

115

125

fi

24

26

28

28

26

30

26

12

Resp:

88 u

8 195 u2

800 710 u3

81 363 125 u4

5) Hallar los momentos del 1 al 4, con relación al origen de: Evaluación fi Resp:

02

05 16

10,2 u

05

08 18

120,05 u2

08

11 32

11

14 36

1 550,45 u3

z2 4 1 z

26

14

17 12

17

20 6

21 412,76 u4


E S TA D Í S T I C A I

6) Hallar los momentos del 1 al 4, con relación al origen de: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi Resp: 1616 u

2 886 400 u2

5,63456 x 109 u3

11,889664 x 1012 u4

7) Hallar los momentos del 1 al 4, con relación al origen de: Ventas (miles)

12

fi Resp:

16

16

20 22,77u

20

20

24

24

24

26

554,47 u2

28

28 32

20

16

14 283,067 u3

32

36 14

384 649,8667 u4

8) Hallar los momentos del 1 al 4, con relación al origen de: Alumnos fi Resp:

92 u

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

9 385,33 u2

1 043 280 u3

124 648 933,33 u4

9) Hallar los momentos del 1 al 4, con relación al origen de: Pensiones fi Resp:

955 u

800

850

900

950

1000

1050

1100

1150

4

16

36

40

26

19

5

4

917 783,33 u2

887 642 500 u3

864 009 958 333,33 u4

5.1.2. Momentos con relación a la Media Aritmética (Mr) La definición de tales momentos basados en la definición de la varianza, como ya se sabe va a depender del estado en que se encuentran los datos, que son no agrupados o dispersos, y las distribuciones de frecuencias o simplemente datos agrupados.

5.1.2.1. Momentos para Datos no Agrupados Cuando la información está desordenada o simplemente hay un grupo de datos (Xi) representados uno por uno que pueden o no estar repetidos, el momento de orden “r” con relación a la media aritmética de N datos se define de la siguiente manera:

z2 4 2 z


WA LT E R C É S P E D E S R A M Í R E Z

Considerando que los valores de “r” van del 1 al 4, los momentos para cada orden son:

Ejercicios resueltos 1) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 14, 18, 20, 13, 11 y 14 Solución:

X = 90 / 6 = 15 M1 = 0 / 6 = 0 u

M2 = 56 / 6 = 9,33 u2

M3 = 82 / 6 = 13,67 u3 M4 = 980 / 6 = 163,33 u4

z2 4 3 z


E S TA D Í S T I C A I

2) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 83, 84, 85, 88, 90, 92 y 95

80, 81, 82,

Solución:

X = 860 / 40 = 86 M1 = 0 / 10 = 0 u

M2 = 228 / 10 = 22,8 u2

M3 = 576 / 10 = 57,6 u3 M4 = 10 404 / 10 = 1 040,4 u4

Resolver los siguientes ejercicios propuestos con datos no agrupados, utilizando Momentos con relación a la media aritmética: 1) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 425, 625, 253, 280, 315, 458, y 500 toneladas. Resp:

0 u,

15 342,86 u2,

643 075,74 u3,

459 398 288,57 u4

2) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 56, 53, 54, 38, 55, 65 y 41 asistentes. Resp:

0 u,

164,6 u2,

987,6 u3,

45, 81, 72,

63 306,2 u4

3) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 157, 185, 164, 155, 187, 154, 188, 124, 152 y 144 soles. Resp:

0 u,

383 u2,

– 580,8 u3,

328 847 u4.

4) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 1 485, 1 457, 1 288, 1 557 y 1 243 participantes Resp:

0 u,

14 427,2 u2,

– 381 027,6 u3,

z2 4 4 z

293 078 084 u4


WA LT E R C É S P E D E S R A M Í R E Z

5) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 53, 45, 38, 44 y 52 empresas. Resp:

0 u,

107,75 u2,

450 u3,

25 790,75 u4

6) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 87, 89, 88, 83, 87 y 90 universitarios. Resp:

0 u,

4 u2,

56, 64, 72,

– 4 u3,

85, 88, 86,

41,33 u4

7) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 252, 257, 265, 268, 272, 250, 257, 250, 255 y 254 soles. Resp:

0 u,

53,6 u2,

275,4 u3,

6 064,4 u4

8) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 15, 16, 9, 14, 10, 12, 7, 13, 18 y 16 puntos. Resp:

0 u,

11 u2,

– 12 u3,

243,8 u4

9) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 760, 860, 700, 830, 730, 880, 760 y 800 litros. Resp:

0 u,

3 525 u2,

17 250 u3,

21 547 500 u4

10) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 2 680, 2 660, 2 900, 2 860 y 2 900 unidades. Resp:

0 u,

11 520 u2,

– 451 200 u3,

160 896 000 u4

5.1.2.2. Momentos para Distribuciones de Frecuencias Cuando la información está ordenada en tablas de distribución de frecuencias, donde la frecuencia absoluta (fi) representa la repetición de la marca de clase (Xi), el momento de orden “r” con relación a la media aritmética de N datos se define de la siguiente manera:

Considerando que los valores de “r” dentro de esta definición, van del 1 al 4, los momentos para cada orden son:

z2 4 5 z


E S TA D Í S T I C A I

Ejercicios resueltos

1) Hallar los momentos del 1 al 4, con relación a la media aritmética utilizando la siguiente distribución de jornales por semana en soles:

Jornales 455 465 465 475 475 485 fi

35

40

485 495 495 505 505 515 515 525

30

18

12

10

5

Solución:

Jornales

fi

Xi

fi Xi

455

465

465

475

35

460

40

470

475 485

485

30

480

14 400

36,00

43,20

51,840

62,2080

495

18

490

8 820

201,60

2 257,92

25 288,704

283 233,4848

495

505

12

500

6 000

254,40

5 393,28

114 337,536

2 423 955,7632

505

515

10

510

5 100

312,00

9 734,40

303 713,280

9 475 854,3360

515

525

5 520

2 600

206,00

8 487,20

349 672,640

14 406 512,7680

71 820

0,00

41 384,00

533 241,600

31 201 690,8800

Σ (Total)

150

fi (Xi – X )

fi (Xi – X )2

16 100

– 658,00

12 370,40

18 800

– 352,00

3 097,60

X = 71 820 / 150 = 478,8 u

z2 4 6 z

fi (Xi – X )3

fi (Xi – X )4

– 232 563,520

4 372 194,1760

27 258,880

239 878,1440


WA LT E R C É S P E D E S R A M Í R E Z

M1 = 0 / 150 = 0 u

M2 = 41 384 / 150 = 275,89 u2

M3 = 533 241,6 / 150 = 3 554,94 u3

M4 = 31 201 690,88 / 150 = 208 011,27 u4

2) Hallar los momentos del 1 al 4, con relación a la media aritmética de las siguientes estaturas en centímetros:

Estaturas

135 145 145 155 155 165 165 175 175 185 185 195

fi

15

25

45

65

25

20

195 205 5

Solución:

Estaturas

fi

Xi

fi Xi

fi (Xi – X )

135

145

15

140

2 100

– 405

10 935

– 295 245

7 971 615

145

155

25

150

3 750

– 425

7 225

– 122 825

2 088 025

155

165

45

160

7 200

– 315

2 205

165

175

65

170 11 050

195

585

175

185

25

180

4 500

325

4 225

54 925

714 025

185

195

20

190

3 800

460

10 580

243 340

5 596 820

195

205

5 200

1 000

165

5 445

179 685

5 929 605

33 400

0

41 200

46 200

22 413 400

Σ (Total)

200

fi (Xi – X )2

fi (Xi – X )3

fi (Xi – X )4

15 435

108 045

1 755

5 265

X = 33 400 / 200 = 167

M1 = 0 / 200 = 0 u

M2 = 41 200 / 200 = 206 u2

M3 = 46 200 / 200 = 231 u3 M4 = 22 413 400 / 200 = 112 067 u4 Resolver los siguientes ejercicios propuestos con datos agrupados o distribuciones de frecuencias, utilizando Momentos con relación a la media aritmética: 1) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Calificación fi Resp:

02

05

05

6 0u

12,69 u2

08 12

08

11 32

– 4,86 u3

z2 4 7 z

11

14 30

14

17

17

16 434,36 u4

20 4


E S TA D Í S T I C A I

2) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp :

0u

284 784 u2

108 377 472 u3

25,77067 x 1010 u4

3) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Ventas (miles)

02

fi

Resp:

06

06

16 0u

10

10

22

32,12 u2

14

14

62

18

18

40

– 3,792 u3

22

22

36

26 24

2 323,592 u4

4) Hallar los momentos del 1 al 4, con relación a la media aritmética de:

Personas

55

65

75

85

95

105

115

125

fi

24

26

28

28

26

30

26

12

Resp:

0u

451 u2

174 u3

377 077 u4

5) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Evaluación

02

fi

Resp:

05

05

16 0u

08

08

18

16,01 u2

11

11

32

14

14

36

– 0,664 u3

17

17

12

20 6

621,4497 u4

6) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

0u

274 944 u2

81 518 592 u3

23,500043 x 1010 u4

7) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Ventas (miles) fi

Resp:

12

16 20

0u

16

20 24

40,87 u2

20

24 26

58,8 u3

z2 4 8 z

24

28 20

28 32

32

16 3 260,4667 u4

36 14


WA LT E R C É S P E D E S R A M Í R E Z

8) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

0u

921,33 u2

10 304 u3

2 428 773,3333 u4

9) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Pensiones fi

Resp:

0u

800

850

900

950

1000

1050

1100

1150

4

16

36

40

26

19

5

4

5 758,33 u2

161 000 u3

z2 4 9 z

94 873 958,33 u4



L e c c i ó n

2

5.2. ASIMETRÍA

Es una de las medidas de concentración estadística llamada también medida de forma hacia los lados (horizontal), porque cuando los datos son representados gráficamente, nos permite observar si existe o no simetría entre ellos. Si se traza una perpendicular al eje X a la altura de la media, se dice que tiene forma simétrica si tiene las mismas frecuencias equidistantes a ambos lados de la media; en caso contrario será de forma asimétrica. Una mayor concentración de datos hacia un lado del gráfico, deforma la figura, por ello se denomina asimétrica. Se denomina asimetría positiva si la mayoría de los datos se encuentran en el lado izquierdo de la media, en caso de concentrarse mayormente los datos en el lado derecho, la distribución tendrá asimétrica negativa. Los indicadores de asimetría, tanto positivo como negativo, determinan el grado de desequilibrio que tienen los datos en su conjunto, a ello se le denomina sesgo. Cuando el sesgo de un conjunto de datos es cero, se dice que la distribución es simétrica y se encuentra en equilibrio. La asimetría resulta útil en muchos campos, muchos modelos simplistas asumen una distribución normal, es decir simétrica en torno a la media. La distribución normal tiene una asimetría igual a cero; pero en realidad, no todos los valores no son perfectamente simétricos y la asimetría de la distribución, nos proporciona una idea sobre si las desviaciones sobre la media son positivas o negativas.

z2 5 1 z


E S TA D Í S T I C A I

5.2.1. Tipos de Asimetría Existen tres tipos de asimetría que son:

5.2.1.1. Asimetría negativa Se dice que una asimetría es negativa, porque el indicador tiene signo negativo; también porque la forma de distribución de sus datos, en todas las asimetrías negativas hay mayor concentración en el lado derecho del eje de simetría, que es una perpendicular trazada sobre la media aritmética, dejando al lado izquierdo menos datos; por ello, en el gráfico se observa que en la izquierda hay una cola más grande que la de la derecha, precisamente esa cola grande representa el sesgo o desequilibrio entre los datos.

5.2.1.2. Simetría Cuando el indicador de asimetría es cero, se dice que la distribución de datos es simétrica. También porque la forma de distribución de los datos, tiene la mayor concentración en el centro del eje de simetría, que es una perpendicular trazada sobre la media aritmética, dejando al lado derecho pocos datos en la misma magnitud de manera equidistante al lado izquierdo, por ello se observa en el gráfico un equilibrio entre los datos, porque ambas colas son iguales.

z2 5 2 z


WA LT E R C É S P E D E S R A M Í R E Z

5.2.1.3. Asimetría Positiva Se dice que una asimetría es positiva, porque el indicador tiene signo positivo; también porque la forma de distribución de sus datos, en todas las asimetrías positivas hay mayor concentración en el lado izquierdo del eje de simetría, que es una perpendicular trazada sobre la media aritmética, dejando al lado derecho menos datos; por ello, en el gráfico se observa que en la derecha hay una cola más grande que la de la izquierda, precisamente esa cola grande representa el sesgo o desequilibrio entre los datos.

5.2.2. Definición de Asimetría Existen diferentes maneras de medir el grado de asimetría que pueda o no existir dentro de un conjunto de datos; este indicador generalmente se multiplica por cien (100) para ser expresado en tanto por ciento (%). Como esta medida de forma de concentración se refiere al desequilibrio que pueda o no existir entre los datos y una medida de carácter central, solo se van a proponer ejercicios para distribuciones de frecuencias, porque ellas albergan una cantidad considerable de datos expresando claramente su forma. Existe una variedad de coeficientes de asimetría, en esta lección se proponen los que mayormente se utilizan y para que usted pueda compararlos, se van a utilizar los mismos ejercicios para cada modelo:

z2 5 3 z


E S TA D Í S T I C A I

5.2.2.1. Asimetría según Pearson Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de 1936) fue un prominente científico, matemático y pensador británico, que estableció la disciplina de la estadística matemática. Desarrolló una intensa investigación sobre la aplicación de los métodos estadísticos en la biología y fue el fundador de la bioestadística. El coeficiente de asimetría de Pearson, sólo se puede utilizar en distribuciones con: una sola moda, campaniformes y moderadamente asimétricas. Pearson la define utilizando la relación empírica entre: media, mediana y moda; de tal relación, se obtienen dos coeficientes llamados primer y segundo coeficiente de asimetría. Pearson se basa en que todas las distribuciones simétricas, tienen: la media, la moda y la mediana iguales; por ello, cualquier diferencia de estas medidas con la media aritmética, representa un sesgo o simplemente asimetría, que representa una proporción o porcentaje de desviación con relación a la desviación estándar. Los coeficientes de asimetría de Pearson (AP), se definen como:

AP1 =

Primer coeficiente de Pearson

[( X – Mo) / S] 100

AP2 = [3( X – Me) / S] 100

Segundo coeficiente de Pearson

Donde: X

= Media Aritmética

Mo = Moda o Modo Me = Mediana S

= Desviación Estándar

Ejercicios resueltos

1) Hallar el primer y segundo coeficiente de asimetría de Pearson utilizando la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 fi

35

40

485 495 495 505 505 515 515 525

30

18

z2 5 4 z

12

10

5


WA LT E R C É S P E D E S R A M Í R E Z

Solución: Jornales

fi

Xi

455

465

35

460

16 100

– 18,80

465

475

40

470

18 800

475

485

30

480

485

495

18

495

505

505

515

515

525

(Xi – X )

fi (Xi – X )

Fi

2

12 370,40

35

8,80

3 097,60

75

14 400

1,20

43,20

105

490

8 820

11,20

2 257,92

123

12

500

6 000

21,20

5 393,28

135

10

510

5 100

31,20

9 734,40

145

5

520

2 600

41,20

8 487,20

150

150

Σ (Total)

fi Xi

71 820

41 384,00

X = 71 820 / 150 = 478,8 u

S2 = 41 384 / 150 = 275,89 u2

S =

Me = 465 + [(75 – 35) / 40] 10 = 475

275.89

= 16,61

Mo = 465 + [5 / (5 +10)] 10 = 468,33

Primer coeficiente de Pearson

AP1 = [(478,8 – 468,33) / 16,61] 100 = 63,03%

Segundo coeficiente de Pearson

AP2 = [3(478,8 – 475) / 16,61] 100 = 68,63%

2) Hallar el primer y segundo coeficiente de asimetría de Pearson con la siguiente distribución de estaturas en centímetros: Estat.

135 145 145 155 155 165 165 175 175 185 185 195 195 205

fi

15

25

45

65

25

20

Solución: Estaturas

fi

Xi

fi Xi

135

145

15

140

2100

– 27

10935

15

145

155

25

150

3750

– 17

7225

40

155

165

45

160

7200

–7

2205

85

165

175

65

170

11050

3

585

150

175

185

25

180

4500

13

4225

175

185

195

20

190

3800

23

10580

195

195

205

5

200

1000

33

5445

200

Σ (Total)

200

(Xi – X )

33400

fi (Xi – X )2

41200

z2 5 5 z

Fi

5


E S TA D Í S T I C A I

X = 33400 / 200 = 167

S2 = 41200 / 200 = 206 u2

206 = 13,35

S =

Me = 165 + [(100 – 85) / 65] 10 = 167,31 Mo = 165 + [20 / (20 +40)] 10 = 168,33 Primer coeficiente de Pearson

AP1 = [(167 – 168,33) / 13,35] 100 = – 9,96%

Segundo coeficiente de Pearson

AP2 = [3(167 – 167,31) / 13,35] 100 = – 6,97%

Resolver los siguientes ejercicios propuestos utilizando las asimetrías de Pearson:

1) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Calificación

02

fi

Resp:

05

05

6

08

08

12

AP1 = 7,58%

11

11

32

14

14

30

17

17

16

20 4

AP2 = 0,00%

2) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

AP1 = 24,80%

AP2 = 37,54%

3) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Ventas (miles)

02

fi

Resp:

06

06

16 AP1 = 35,63%

10

10

22

14 62

14

18 40

18

22 36

AP2 = 31,75%

4) Hallar el primer y segundo coeficiente de asimetría de Pearson con:

Personas

55

65

75

85

95

105

115

125

fi

24

26

28

28

26

30

26

12

Resp:

AP1 = – 80,04%

AP2 = 1,98%

z2 5 6 z

22

26 24


WA LT E R C É S P E D E S R A M Í R E Z

5) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Evaluación

02

fi

Resp:

05

05

16

08

08

18

AP1 = – 30,75%

11

11

32

14

14

36

17

17

12

20 6

AP2 = – 18,00%

6) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

AP1 = 17,10%

AP2 = 27,46%

7) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Ventas (miles)

12

fi

Resp:

16

16

20 AP1 = – 31,30%

20

20

24

24

24

26

28 20

28 32 16

32

36 14

AP2 = 25,35%

8) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

AP1 = 24,77%

AP2 = 24,57%

9) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Pensiones fi

Resp:

800

850

900

950

1000

1050

1100

1150

4

16

36

40

26

19

5

4

AP1 = 24,89%

AP2 = 24,71%

5.2.2.2. Asimetría según Fisher Ronald Aylmer Fisher, (n. 17 de febrero de 1890 – m. 29 de julio de 1962) científico, matemático, estadístico, biólogo evolutivo y genetista inglés. Fisher realizó muchos avances en la estadística, siendo una de sus más importantes contribuciones, la inferencia estadística creada por él en 1920. Con relación a la asimetría, este tipo de asimetría Fisher la mide con relación a la media aritmética. z2 5 7 z


E S TA D Í S T I C A I

Cuando la distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda de la media aritmética, y por tanto el mismo número de desviaciones con signo positivo que con signo negativo, siendo la suma de desviaciones positivas igual a la suma de las negativas. Se puede decir entonces que a partir de las desviaciones (Xi – X ) elevadas a una potencia impar para no perder los signos de las desviaciones; lo más sencillo sería tomar más simple (que es tres), es decir, que Fisher toma como medida de asimetría el momento de orden tres centrado en la media. Pero, de hacer esto, esta medida vendría expresada en las mismas unidades que las de la variable, pero elevadas al cubo, por lo que no es invariante ante un cambio de escala. Para conseguir un indicador unidimensional, se debe dividir la expresión anterior por una cantidad que venga en sus mismas unidades de medida, que es la desviación típica al cubo. En estadística, la medida de asimetría más utilizada parte del uso del tercer momento estándar, por que como ya se ha mencionado, interesa mantener el signo de las desviaciones con respecto a la media, para determinar si dichas desviaciones son mayores en el lado derecho de la media o en el lado izquierdo. El coeficiente de asimetría de Fisher, mide la desviación de los datos conforme a la media con relación a la desviación estándar. El coeficiente de asimetría de Fisher (AF), se define como: AF = [M3 / M23 / 2] 100

o también;

AF = [M3 / S3] 100

Donde: M3 = Momento del orden 3 con relación a la media aritmética M2 = Momento del orden 2 con relación a la media aritmética S = Desviación estándar

Coeficiente de asimetría de Fisher estandarizado Este coeficiente estandarizado, se aplica al modelo de distribución normal (Estadística II) y se puede realizar cuando N >150, donde la varianza es 6/N. El coeficiente de asimetría es asintóticamente normal con media igual a cero (0) y varianza igual a uno (1) en términos del coeficiente, que se define de la siguiente manera:

Esta definición solo es para conocimiento, porque su uso corresponde a Estadística II. z2 5 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos:

1) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de jornales por semana en soles: Jornales

455 465 465 475 475 485

fi

35

40

485 495 495 505 505 515 515 525

30

18

12

10

5

Solución:

Jornales

fi

Xi

455

465

35

460

16 100

– 18,80

465

475

40

470

18 800

475

485

30

480

14 400

1,20

43,20

51,840

485

495

18

490

8 820

11,20

2 257,92

25 288,704

495

505

12

500

6 000

21,20

5 393,28

114 337,536

505

515

10

510

5 100

31,20

9 734,40

303 713,280

515

525

5

520

2 600

41,20

8 487,20

349 672,640

Σ (Total)

150

fi Xi

(Xi – X )

12 370,40

8,80

71 820

X = 71 820 / 150 = 478,8 u

fi (Xi – X )2 3 097,60

41 384,00

fi (Xi – X )3 – 232 563,520 –

27 258,880

533 241,600

M3 = 533 241,6 / 150 = 3 554,94 u3

S2 = 41 384 / 150 = 275,89 u2

S =

275.89 = 16,61

AF = [3 554,94 / 16,613] 100 = 77,58% 2) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de estaturas en centímetros: Estaturas 135 145 fi

15

145 155 155 165 165 175 175 185 185 195 195 205 25

45

65

z2 5 9 z

25

20

5


E S TA D Í S T I C A I

Solución: Estaturas

fi

Xi

fi Xi

(Xi – X )

fi (Xi – X )2

fi (Xi – X )3

135

145

15

140

2100

– 27

10935

– 295245

145

155

25

150

3750

– 17

7225

– 122825

155

165

45

160

7200

– 7

2205

165

175

65

170

11050

585

1755

175

185

25

180

4500

13

4225

54925

185

195

20

190

3800

23

10580

243340

195

205

5

200

1000

33

5445

179685

41200

46200

Σ (Total)

X

200

3

33400

= 33 400 / 200 = 167

S2 = 41 200 / 200 = 206 u2

15435

M3 = 46 200 / 200 = 231 u3

206

S =

= 13,35

AF = [231 / 13,353] 100 = 9,71%

Resolver los siguientes ejercicios propuestos utilizando la asimetría de Fisher: 1) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Calificación

02

fi

Resp:

05

05

6

08

08

12

11

11

32

14

14

30

17

17

16

20 4

– 10,75%

2) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp :

71,31%

3) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Ventas (miles) fi

Resp:

02

06 16

06

10

10

22

– 2,08% z2 6 0 z

14 62

14

18 40

18

22 36

22

26 24


WA LT E R C É S P E D E S R A M Í R E Z

4) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Personas fi

Resp:

55

65

75

85

95

105

115

125

24

26

28

28

26

30

26

12

1,82%

5) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Evaluación

02

fi

Resp:

05

05

16

08

08

18

11

11

32

14

14

36

17

17

12

20 6

– 1,04%

6) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

56,54%

7) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Ventas (miles)

12

fi

Resp:

16

16

20

20

20

24

24

24

26

28 20

28 32 16

32

36 14

22,50%

8) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

36,85%

9) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Pensiones

800

850

900

950

1000

1050

1100

1150

fi 4 16 36 40 26 19 5 4 Resp: 36,85% z2 6 1 z


E S TA D Í S T I C A I

5.2.2.3. Asimetría según Bowley Arturo Lyon Bowley (Bristol, Inglaterra 6 de noviembre, 1869 - 21 de enero, 1957) era un inglés estadístico y economista quién trabajó en estadística económica e inició el uso de las técnicas de muestreo en exámenes sociales. Este tipo de asimetría, Bowley la mide con relación a la desviación o rango que hay entre el cuartil 3 (Q3) y el cuartil 1 (Q1). El coeficiente de asimetría de Bowley, se basa en que si la posición central de una distribución de datos que es la mediana (Me) o el segundo cuartil (Q2), tiene la misma desviación con el primer cuartil (Q1) que con el tercer cuartil (Q3), se dice que la distribución es simétricas. Cualquier diferencia entre estas desviaciones, representa un sesgo o simplemente asimetría. El coeficiente de asimetría de Bowley (ABQ), que representa una proporción o porcentaje de las desviaciones con respecto a la mediana entre la desviación del Q3 menos el Q1. Dicho coeficiente se definen como: ABQ = {[(Q3 – Me) – (Me – Q1)] / [Q3 – Q1]} 100

o

también

ABQ = [(Q3 – 2Q2 + Q1) / (Q3 – Q1)] 100 Donde: Q3 = Cuartil 3 Q1 = Cuartil 1 Me = Mediana = Cuartil 2 (Q2) Algunos investigadores estadísticos han observado que entre los Q1 y Q3, solo existe el 50% de los datos, por lo que piensan que el coeficiente de Bowley elimina el otro 50% repartidos entre el 25% inicial y el 25% final que representan a los extremos de un conjunto ordenado de datos. Esta iniciativa de Bowley que restringe el rango al 50%, también puede ser utilizada en Percentiles que permite ampliar más el rango del 50% al 80%, de la siguiente manera:

ABP = {[(P90 – Me) – (Me – P10)] / [P90 – P10]} 100 ABP = [(P90 – 2P50 + P10) / (P90 – P10)] 100 Donde: P90 = Percentil 90 P10 = Percentil 10 Me = Mediana = Percentil 50 (P50) z2 6 2 z

o

también


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 fi

35

40

30

18

505 515 515 525

12

10

5

Solución: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi

35

40

30

18

12

10

5

Fi

35

75

105

123

135

145

150

Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63 Q2 = 465 + [(75 – 35) / 40] 10 = 475

P10 = 455 + [(15 – 0) / 35] 10 = 459,29

P50 = Me = Q2 = 475

Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17

P90 = 495 + [(135 – 123) / 12] 10 = 505

Coeficiente de Bowley con cuartiles:

ABQ = [(489,17 – 2(475) + 465,63) / (489,17 – 465,63)] 100 = 20,39%

Coeficiente ampliado con percentiles: ABP = [(505 – 2(475) + 459,29) / (505 – 459,29)] 100 = 31,26%

2) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles utilizando la siguiente distribución de estaturas en centímetros: Estat.

135 145 145 155 155 165

fi

15

25

165 175 175 185 185 195 195 205

45

65

25

20

5

Solución: Estat. 135 145 145 155 155 165 165 175 175 185 185 195 195 205 fi

15

25

45

65

25

20

5

Fi

15

40

85

150

175

195

200

Q1 = 155 + [(50 – 40) / 45] 10 = 157,22

P10 = 145 + [(20 – 15) / 25] 10 = 147

Q2 = 165 + [(100 – 85) / 65] 10 = 167,31 Q3 = 165 + [(150 – 85) / 65] 10 = 175

P50 = Me = Q2 = 167,31

P90 = 185 + [(180 – 175) / 20] 10 = 187,5

z2 6 3 z


E S TA D Í S T I C A I

Coeficiente de Bowley con cuartiles:

ABQ = [(175 – 2(167,31) + 157,22) / (175 – 157,22)] 100 = – 13,50% Coeficiente ampliado con percentiles: ABP = [(187,5 – 2(167,31) + 147) / (187,5 – 147)] 100 = – 0,30%

Resolver los siguientes ejercicios propuestos utilizando las asimetrías de Bowley:

1) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Calificación

02

fi

Resp:

05

05

6 ABQ =

08

08

12

11

11

32

14

14

30

17

17

16

20 4

ABP = – 1,21%

3,31%

2) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

ABQ =

3,97%

ABP = 22,73%

3) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Ventas (miles)

02

fi

Resp:

06

06

16 ABQ = 22,54%

10

10

22

14 62

14

18 40

18

22 36

22

26 24

ABP = 8,78%

4) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Personas fi

Resp:

ABQ =

55

65

75

85

95

105

115

125

24

26

28

28

26

30

26

12

0,78%

ABP = – 0,80% z2 6 4 z


WA LT E R C É S P E D E S R A M Í R E Z

5) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Evaluación

02

fi

Resp:

05

05

16

08

08

18

ABQ = – 9,70%

11

11

32

14

14

36

17

17

12

20 6

ABP = – 10,04%

6) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

ABQ =

4,47%

ABP = 15,29%

7) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Ventas (miles)

12

fi

Resp:

16

16

20 ABQ =

7,26%

20

20

24

24

24

26

28 20

28 32 16

32

36 14

ABP = 11,28%

8) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Alumnos fi

Resp:

ABQ =

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

7,94%

ABP = 10,55%

9) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Pensiones

fi Resp:

ABQ =

800

850

900

950

1000

1050

1100

1150

4

16

36

40

26

19

5

4

7,95%

ABP = 10,55%

5.2.2.4. Asimetría según Yule George Udny Yule (Colina de la haya cerca Haddington, Escocia 18 de febrero, 1871 – Cambridge, Inglaterra 26 de junio, 1951) era conocido generalmente como Udny Yule z2 6 5 z


E S TA D Í S T I C A I

que vino de una familia escocesa establecida integrada por oficiales de ejército, funcionarios, eruditos, y administradores. A la edad de 16, Udny comenzó a estudiar ingeniería en Universidad de Londres y más adelante se trasladó a Bonn, Alemania, donde él estudió debajo del científico famoso Heinrich Herz. Una gran influencia en su vida académica era el estadístico Karl Pearson, quien lo persuadió para que vuelva de nuevo a Londres. Yule era escritor prolífico, el toque de luz de sus publicaciones que eran quizás libro de textos Introducción a la teoría de la estadística, que pasó a través de catorce ediciones. Él era activo en Sociedad estadística real, al que le concedieron la Medalla del individuo en oro en 1911, fue posteriormente su presidente entre 1924-26. Yule no desarrolló completamente ninguna ramas de la teoría estadística, él tomó las primeras medidas en muchas direcciones que eran más adelante probar las líneas fructuosas para el progreso adicional, fue uno de los pioneros de la estadística moderna por que hizo contribuciones importantes a la teoría y a la práctica de: correlación, regresión, y asociación, así como el análisis de la serie de tiempo. Este tipo de simetría, Yule la mide con relación al centro de la distribución (Mediana). El coeficiente de asimetría de Yule (AYQ), que representa una proporción o porcentaje de las desviaciones con respecto a la mediana entre 2 veces la mediana que se define como: AYQ = {[(Q3 – Me) – (Me – Q1)] / 2 Me} 100

o

también

AYQ = [(Q3 – 2Q2 + Q1) / 2Q2] 100 Donde: Q3 = Cuartil 3 Q1 = Cuartil 1 Me = Mediana = Cuartil 2 (Q2) Algunos investigadores estadísticos han observado que entre los Q1 y Q3, solo existe el 50% de los datos, por lo que piensan que el coeficiente de Yule elimina el otro 50% repartidos entre el 25% inicial y el 25% final que representan a los extremos de un conjunto ordenado de datos. Esta iniciativa de Yule utilizada también por Bowley que restringe el rango al 50%, se utiliza también en Percentiles, para ampliar el rango del 50% al 80% de la siguiente manera: AYP = {[(P90 – Me) – (Me – P10)] / 2 Me} 100 AYP = [(P90 – 2P50 + P10) / 2P50] 100

Donde: P90 = Percentil 90 P10 = Percentil 10 Me = Mediana = Percentil 50 (P50) z2 6 6 z

o

también


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos

1) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 fi

35

40

30

18

12

10

515 525 5

Solución: Jornales

455 465 465 475 475 485 485 495 495 505 505 515 515 525

fi

35

40

30

18

12

10

5

Fi

35

75

105

123

135

145

150

Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63

P10 = 455 + [(15 – 0) / 35] 10 = 459,29

Q2 = 465 + [(75 – 35) / 40] 10 = 475

P50 = Me = Q2 = 475

Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17

P90 = 495 + [(135 – 123) / 12] 10 = 505

Coeficiente de Yule con cuartiles: AYQ = [(489,17 – 2(475) + 465,63) / 2(475)] 100 = 0,51% Coeficiente ampliado con percentiles: AYP = [(505 – 2(475) + 459,29) / 2(475)] 100 = 1,50%

2) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles utilizando la siguiente distribución de estaturas en centímetros: Estat. 135 145 145 155 155 165 165 175 175 185 185 195 195 205 fi

15

25

45

65

25

20

5

Solución: Estat. 135 145 145 155 155 165 165 175 175 185 185 195

195 205

fi

15

25

45

65

25

20

5

Fi

15

40

85

150

175

195

200

Q1 = 155 + [(50 – 40) / 45] 10 = 157,22

P10 = 145 + [(20 – 15) / 25] 10 = 147

Q2 = 165 + [(100 – 85) / 65] 10 = 167,31

P50 = Me = Q2 = 167,31

Q3 = 165 + [(150 – 85) / 65] 10 = 175

P90 = 185 + [(180 – 175) / 20] 10 = 187,5 z2 6 7 z


E S TA D Í S T I C A I

Coeficiente de Yule con cuartiles: AYQ = [(175 – 2(167,31) + 157,22) / 2(167,31)] 100 = – 0,72% Coeficiente ampliado con percentiles: AYP = [(187,5 – 2(167,31) + 147) / 2(167,31)] 100 = – 0,04%

Resolver los siguientes ejercicios propuestos utilizando las asimetrías de Yule:

1) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Calificación

02

fi

Resp:

05

05

6 AYQ =

08

08

12

11

11

32

14

14

30

17

17

16

20 4

AYP = – 0,55%

0,73%

2) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

AYQ =

0,89%

AYP = 10,54%

3) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Ventas (miles)

02

fi

Resp:

06

06

16 AYQ = 6,71%

10

10

22

14 62

14

18 40

18

22 36

22

26 24

AYP = 5,00%

4) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Personas fi

Resp:

AYQ =

55

65

75

85

95

105

115

125

24

26

28

28

26

30

26

12

0,16%

AYP = – 0,27% z2 6 8 z


WA LT E R C É S P E D E S R A M Í R E Z

5) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Evaluación

02

fi

Resp:

05

05

16

08

08

18

AYQ = – 2,63%

11

11

32

14

14

36

17

17

12

20 6

AYP = – 5,41%

6) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

AYQ =

1,02%

AYP = 6,82%

7) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Ventas (miles)

12

fi

Resp:

16

16

20 AYQ =

1,67%

20

20

24

24

24

26

28 20

28 32 16

32

36 14

AYP = 4,56%

8) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Alumnos fi

Resp:

AYQ =

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

1,91%

AYP = 4,71%

9) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Pensiones

fi Resp:

AYQ =

800

850

900

950

1000

1050

1100

1150

4

16

36

40

26

19

5

4

0,45%

AYP = 1,11%

z2 6 9 z


E S TA D Í S T I C A I

5.2.2.5. Asimetría según Kelly El coeficiente de asimetría de Kelly (AK), representa la asimetría o sesgo existente en una de las colas. Para Kelly la asimetría debe ser medida por la posición central que es la mediana menos la mitad de las desviaciones entre el percentil 90 (P90) menos el percentil 10 (P10). Kelly fue el primero en utilizar percentiles en el cálculo de la asimetría, por esta razón con este aporte, los investigadores con posterioridad utilizaron estos percentiles en las asimetrías de Bowley y de Yule. Este tipo de asimetría tiene poco uso, debido a que se encuentra medida en unidades de información; es decir que si se utilizan soles, la asimetría esta en soles, La asimetría en las mismas unidades de la información, se define como:

AK =

Me – [(P90 + P10) / 2]

Donde: P90 = Percentil 90 P10 = Percentil 10 Me = Mediana = Percentil 50 (P50) Ejercicio resuelto Hallar el coeficiente de asimetría de Kelly con la siguiente distribución de frecuencias con los jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi

35

40

30

18

12

10

5

Solución: Jornales 455 465 465 475

475 485 485 495 495 505 505 515 515 525

fi

35

40

30

18

12

10

5

Fi

35

75

105

123

135

145

150

P10 = 455 + [(15 – 0) / 35] 10 = 459,29 Me = 465 + [(75 – 35) / 40] 10 = 475

P90 = 495 + [(135 – 123) / 12] 10 = 505 AK = 475 – [(505 + 459,29) / 2] = – 7,15 soles Por tener poco uso este coeficiente de asimetría, se ha creído conveniente hacer un solo ejercicio aplicativo, para conocimiento del lector. z2 7 0 z


L e c c i ó n

3

5.3. CURTOSIS Es una medida de forma hacia arriba (perpendicular), que en una distribución de frecuencias señala el grado de presencia de observaciones muy alejadas de la media, tomando como medida la desviación típica; por consiguiente, una distribución de frecuencias con gran curtosis, será aquella en que hay observaciones situadas a una distancia de la media igual a varias veces la desviación típica. Cuantas más observaciones alejadas de esa forma existan dentro de un conjunto de datos, habrá mayor curtosis, por el contrario si una variable no tiene observaciones cuya distancia a la media sea de varias veces la desviación típica, o las haya en grado mínimo, tendrá una curtosis pequeña. A menudo, en una variable con alta curtosis, al haber una cierta cantidad de observaciones muy alejadas de la media, en relación a su propia desviación típica, debe tener el resto de sus observaciones muy cercanas a la media, en comparación a su desviación típica. Esto hace que una curtosis elevada suela acompañarse de frecuencias relativamente muy grandes entorno a la media, dando lugar a un diagrama de frecuencias con forma “puntiaguda” en la media, de ahí el nombre alternativo de apuntamiento para la curtosis. Para entender correctamente el concepto de curtosis, es importante no confundir “curtosis alta” con “dispersión alta”. Una distribución de frecuencias con una cantidad importante de valores muy alejados de la media puede tener, por eso mismo, una dispersión elevada, pero no necesariamente una curtosis alta. Para que se dé una curtosis elevada tiene que ocurrir que esas grandes desviaciones respecto a la media, sean grandes en comparación a la desviación típica. De esa manera, puede verse que la cantidad de curtosis no está relacionada en absoluto con la dispersión de la distribución, sino con la forma de distribuirse esta dispersión.

z2 7 1 z


E S TA D Í S T I C A I

Se dice que una distribución tiene un apuntamiento o no, siempre en función de la distribución normal, que es representada gráficamente por la campana de Gauss a través de una función matemática llamada ley normal o función de densidad de la distribución, tal campana se define de la siguiente manera:

En esta función de densidad normal se produce una inflexión a la altura de la ordenada cuando la abscisa es igual a ( X + S) y también se produce otra cuando es igual a ( X – S). Como se sabe, una inflexión es el cambio de dirección de una curva porque siendo cóncava se vuelve convexa o viceversa.

El nombre de esta medida de concentración, proviene del griego “kyrtos o kurtos” que significa convexo, y de Kurtosis o Cyrtosis que significa curva convexa. Normalmente la palabra curtosis se escriba con “C”, mientras que para el coeficiente se reserva la letra “K”. En teoría de la probabilidad y estadística, la curtosis es una medida de altura de la distribución de probabilidad de una variable aleatoria de número real, que a pesar de encontrarse dividida por la varianza al cuadrado, no necesariamente una mayor varianza da un menor coeficiente de curtosis.

z2 7 2 z


5.3.1. Tipos de Curtosis Curtosis se presenta de tres maneras que son:

5.3.1.1. Platicúrtica El término platicúrtica proviene del griego “plato” que significa chato; se dice que un conjunto de datos tiene forma platicúrtica, cuando la altura de la concentración de datos, es menor a la altura que tendría una distribución de las características del modelo de probabilidad Normal.

5.3.1.2. Mesocúrtica El término mesocúrtica proviene del griego “meso” que significa medio; se dice que un conjunto de datos tiene forma mesocúrtica, cuando la altura de la concentración de datos, es igual a la altura que tendría una distribución de las características del modelo de probabilidad Normal.

z2 7 3 z


E S TA D Í S T I C A I

5.3.1.3. Leptocúrtica El término leptocúrtica proviene del griego “lepto” que significa alto; se dice que un conjunto de datos tiene forma leptocúrtica, cuando la altura de la concentración de datos, es mayor a la altura que tendría una distribución de las características del modelo de probabilidad Normal.

5.3.2. Utilidad del Coeficiente de Curtosis La curtosis nos informa sobre la existencia (o no) de observaciones mucho más alejadas a la media que la mayoría de ellas. En una distribución de frecuencias con curtosis alta (leptocúrtica), pueden encontrarse valores “excepcionalmente” alejados de la media; en una con curtosis baja, es imposible o muy infrecuente que eso se dé. Una curtosis elevada va, en cierta forma, asociada al concepto de “riesgo”: podrían registrarse valores de la variable muy diferentes a los habituales, y, por tanto, se haría difícil una predicción segura. z2 7 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Algunos ejemplos serían los siguientes: 1. Si sabemos que un determinado producto ofrece unos beneficios mensuales con una media de 15 millones de soles y una desviación típica de 5 millones, nos podríamos hacer una idea del rango aproximado del beneficio mensual usando el Teorema de Tchebycheff: en una gran mayoría de los meses los beneficios estarían entre 5 y 25 millones. Sin embargo, el conocimiento de la curtosis nos ayudaría a matizar esta información: si los beneficios tienen poca curtosis, no habrá (apenas) valores excepcionalmente alejados de la media y, por ello, en el intervalo (5, 25) estarán prácticamente el 100% de los valores mensuales de beneficios; si la curtosis fuese alta habría algunos meses en donde el beneficio sería considerablemente menor o considerablemente mayor que lo indicado en ese intervalo. En el caso primero sería casi imposible encontrar un mes con pérdidas, en el segundo caso sería posible observar esa circunstancia: el “riesgo” sería mayor. 2. Si en una localidad “A” la lluvia anual es una distribución de frecuencias con moderada dispersión y mucha curtosis, ocurrirá que el comportamiento pluvial será relativamente estable año tras año, sin grandes altibajos, pero, excepcionalmente, se producirán años con una precipitación muy diferente de las habituales: o bien años muy secos, o bien años extremadamente lluviosos. Si en otra localidad “B” la lluvia anual es una distribución de frecuencias con gran dispersión pero con curtosis moderada, habrá constantemente una gran variabilidad interanual en la precipitación, y por tanto los años muy secos o extremadamente lluviosos no serán vistos como “excepcionales” o “imprevistos”, sino que ocurrirán con cierta frecuencia. La dificultad en la “predicción” de valores futuros de una distribución de frecuencias de elevada curtosis reside en que es difícil saber hasta dónde pueden darse sus valores, por muchas observaciones que se tengan recogidas hasta el presente. De nuevo aparece el concepto de “riesgo” relacionado con la curtosis.

5.3.3. Definición de Curtosis Existen diferentes maneras de medir el grado de apuntamiento o altura de un conjunto de datos. Como esta medida de forma de concentración se refiere a la altura o elevación que pueda existir entre los datos con relación al modelo normal, solo se van a proponer ejercicios para distribuciones de frecuencias, porque ellas albergan una cantidad considerable de datos expresando claramente su forma de altura. Existe una variedad de coeficientes de curtosis, en esta lección se proponen dos que mayormente se utilizan:

5.3.3.1. Curtosis según Fisher Ronald Fisher toma como medida de apuntamiento o curtosis el momento de orden cuatro centrado en la media, pero como esta medida esta expresada a la cuarta, para conseguir un indicador unidimensional, se debe dividir la expresión anterior por una z2 7 5 z


E S TA D Í S T I C A I

cantidad que venga en sus mismas unidades de medida, que es la varianza al cuadrado (M22 = S4). La medida de curtosis más utilizada en estadística es el coeficiente de Fisher (KF), que cuando es igual a tres (3), se dice que la distribución de datos tiene características de una distribución de probabilidad normal. El coeficiente de Fisher se basa en la definición de curtosis hecha por primera vez en 1905 por Pearson, quien afirmó que: K = ∑(X – μ)4 / [∑(X – μ)2]2. En esta definición de curtosis hecha para la Estadística Inferencial, se dice que si K es igual a 3, la distribución de probabilidad es normal o sea mesocúrtica; en cambio si es menor de 3, la distribución es platicúrtica, mientras que se es mayor de 3, la distribución es leptocúrtica. Esta misma definición de Pearson, Fisher la utiliza en la Estadística Descriptiva utilizando momentos, tal como se muestra a continuación:

KF = M4 / M22

o también;

KF = M4 / S4

Donde: M4 = Momento del orden 4 con relación a la media aritmética M2 = Momento del orden 2 con relación a la media aritmética o Varianza

S

= Desviación estándar.

Según este coeficiente, los tres tipos de curtosis se dan, cuando:

KF = M4 / S4 < 3 (Se dice que la distribución es Platicúrtica) KF = M4 / S4 = 3 (Se dice que la distribución es Mesocúrtica) KF = M4 / S4 > 3 (Se dice que la distribución es Leptocúrtica). También se presenta el coeficiente de Fisher restándole tres (3), para hacer que la distribución normal sea cero (0), de la siguiente manera:

KF = [M4 / S4] – 3 < 0

(Tiene menos punta que la distribución normal, Platicúrtica)

KF = [M4 / S ] – 3 = 0

(Tiene igual punta que la distribución normal, Mesocúrtica)

KF = [M4 / S ] – 3 > 0

(Tiene más punta que la distribución normal, Leptocúrtica)

4

4

Ejercicios resueltos

1) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 fi

35

40

30

18

z2 7 6 z

12

10

515 525 5


WA LT E R C É S P E D E S R A M Í R E Z

Solución: Jornales

fi

Xi

fi Xi

455

465

35

460

16 100

– 18,80

465

475

40

470

18 800

475

485

30

480

485

495

18

495

505

505

515

515

525

Σ (Total)

(Xi – X )

fi (Xi – X )2

fi (Xi – X )4

12 370,40

4 372 194,1760

8,80

3 097,60

239 878,1440

14 400

1,20

43,20

62,2080

490

8 820

11,20

2 257,92

283 233,4848

12

500

6 000

21,20

5 393,28

2 423 955,7632

10

510

5 100

31,20

9 734,40

9 475 854,3360

5

520

2 600

41,20

8 487,20

14 406 512,7680

41 384,00

31 201 690,8800

150

71 820

X = 71 820 / 150 = 478,8 u

M2 = 41 384 / 150 = 275,89 u2 M4 = 31 201 690,88 / 150 = 208 011,27 u4 KF = 208 011,27 / 275,892 = 2,73 (Platicúrtica)

2) Hallar el coeficiente de curtosis de Fisher utilizando las siguientes estaturas en centímetros:

Estaturas 135 145 145 155 fi

15

155 165 165 175

25

45

65

175 185 185 195 195 205 25

20

5

Solución:

Estaturas

fi

Xi

fi Xi

135

145

15

140

2 100

– 27

10 935

7 971 615

145

155

25

150

3 750

– 17

7 225

2 088 025

155

165

45

160

7 200

– 7

2 205

108 045

165

175

65

170

11 050

3

585

5 265

175

185

25

180

4 500

13

4 225

714 025

185

195

20

190

3 800

23

10 580

5 596 820

195

205

5

200

1 000

33

5 445

5 929 605

41 200

22 413 400

Σ (Total)

200

(Xi – X )

33 400

z2 7 7 z

fi (Xi – X )

2

fi (Xi – X )

4


E S TA D Í S T I C A I

X = 33 400 / 200 = 167

M2 = 41 200 / 200 = 206 u2 M4 = 22 413 400 / 200 = 112 067 u4 KF = 112 067 / 2062 = 2,64 (Platicúrtica) Resolver los siguientes ejercicios propuestos utilizando el coeficiente de curtosis de Fisher: 1) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Calificación

02

fi Resp:

05

05

6

08

08

12

11

11

32

14

14

30

17

17

16

20 4

2,70 (Platicúrtica)

2) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi Resp:

3,18 (Leptocúrtica)

3) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Ventas (miles)

02

fi Resp:

06

06

16

10

10

22

14

14

62

18

18

40

22

22

36

26 24

2,25 (Platicúrtica)

4) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Personas

55

65

75

85

95

105

115

125

fi

24

26

28

28

26

30

26

12

Resp:

1,85 (Platicúrtica)

5) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Evaluación fi Resp:

02

05 16

05

08 18

08

11 32

2,42 (Platicúrtica) z2 7 8 z

11

14 36

14

17 12

17

20 6


WA LT E R C É S P E D E S R A M Í R E Z

6) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi Resp:

3,11 (Leptocúrtica)

7) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Ventas (miles)

12

fi Resp:

16

16

20

20

20

24

24

24

26

28 20

28 32 16

32

36 14

1,95 (Platicúrtica)

8) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Alumnos

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

fi Resp:

2,86 (Platicúrtica)

9) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Pensiones

800

850

900

950

1000

1050

1100

1150

fi 4 16 36 40 26 19 5 4 Resp: 2,86 (Platicúrtica)

5.3.3.2. Curtosis según Cuantiles Conociendo la utilidad de los cuantiles para el cálculo de la asimetría, los investigadores estadísticos, han propuesto una fórmula donde se conjugan los cuartiles y percentiles, que ha tenido acogida en el cálculo de curtosis; esta medida de forma de punta, divide media variación cuartílica entre la variación percentílica. El coeficiente de curtosis con cuantiles, se define de la siguiente manera: KC = (Q3 – Q1) / 2 (P90 – P10)

o también;

Donde: Q3 = Cuartil 3 Q1 = Cuartil 1 P90 = Percentil 90 P10 = Percentil 10 z2 7 9 z

KC = 0,5 (Q3 – Q1) / (P90 – P10)


E S TA D Í S T I C A I

Según este coeficiente, los tres tipos de curtosis se dan, cuando:

KC = 0,5 (Q3 – Q1) / (P90 – P10) < 0,263 (Se dice que la distribución es Platicúrtica) KC = 0,5 (Q3 – Q1) / (P90 – P10) = 0,263 (Se dice que la distribución es Mesocúrtica) KC = 0,5 (Q3 – Q1) / (P90 – P10) > 0,263 (Se dice que la distribución es Leptocúrtica) Esta fórmula que emplea cuartiles y percentiles, si es utilizada por los investigadores de Estadística, por lo tanto se desarrollará a continuación ejercicios aplicativos relacionados con esta definición de curtosis.

Ejercicios resueltos 1) Hallar el coeficiente de curtosis con cuantiles utilizando la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi

35

40

30

18

12

10

5

Solución: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi

35

40

30

18

12

10

5

Fi

35

75

105

123

135

145

150

Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17 Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63 P90 = 495 + [(135 – 123) / 12] 10 = 505 P10 = 455 + [(15 – 0) / 35] 10 = 459,29 KC = 0.5 (489,17 – 465,63) / (505 – 459,29) = 0,2575 (Platicúrtica) 2) Hallar el coeficiente de curtosis con cuantiles utilizando la siguiente distribución de estaturas en centímetros: Estat. 135 145 145 155 155 165 fi

15

25

165 175 175 185 185 195 195 205

45

65

25

20

5

Solución: Estat.

135 145 145 155 155 165 165 175

175 185 185 195 195 205

fi

15

25

45

65

25

20

5

Fi

15

40

85

150

175

195

200

z2 8 0 z


WA LT E R C É S P E D E S R A M Í R E Z

Q3 = 165 + [(150 – 85) / 65] 10 = 175

Q1 = 155 + [(50 – 40) / 45] 10 = 157,22 P90 = 185 + [(180 – 175) / 20] 10 = 187,5 P10 = 145 + [(20 – 15) / 25] 10 = 147 KC = 0.5 (175 – 157,22) / (187,5 – 147) = 0,2195 (Platicúrtica) Resolver los siguientes ejercicios propuestos utilizando curtosis con cuantiles: 1) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Calificación

02

fi

Resp:

05

05

6

08

08

12

11

11

32

14

14

30

17

17

16

20 4

0,2449 (Platicúrtica)

2) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

0,2416 (Platicúrtica)

3) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Ventas (miles)

02

fi

Resp:

06

06

16

10

10

22

14

14

62

18

18

40

22

22

36

26 24

0,2616 (Platicúrtica)

4) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos:

Personas

55

65

75

85

95

105

115

125

fi

24

26

28

28

26

30

26

12

Resp:

0,3072 (Leptocúrtica)

5) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Evaluación fi

Resp:

02

05

05

16

08 18

08

11 32

0,2520 (Platicúrtica) z2 8 1 z

11

14 36

14

17 12

17

20 6


E S TA D Í S T I C A I

6) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

0,2555 (Platicúrtica)

7) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Ventas (miles)

12

fi

16

16

20

Resp:

20

20

24

24

24

26

28 20

28 32 16

32

36 14

0,2843 (Leptocúrtica)

8) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

0,2688 (Leptocúrtica)

9) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Pensiones

800

850

900

950

1000

1050

1100

1150

fi 4 16 36 40 26 19 5 4

Resp:

0,2688 (Leptocúrtica)

5.3.3.3. Curtosis según Moors En 1988, Moors define un coeficiente de curtosis basado en octiles; es decir, cuantiles dividido en 8 partes iguales que los utiliza en la fórmula siguiente:

K = (O7 – O5) + (O3 – O1) / (O6 – O2)

Donde: O1 O2 O3 O4 O5 O6 O7

= = = = = = =

Octil Octil Octil Octil Octil Octil Octil

1 2 3 4 5 6 7

(Ubicado (Ubicado (Ubicado (Ubicado (Ubicado (Ubicado (Ubicado

al al al al al al al

12,5 25,0 37,5 50,0 62,5 75,0 87,5

% % % % % % %

de de de de de de de

los los los los los los los

datos datos datos datos datos datos datos z2 8 2 z

ordenados) ordenados) ordenados) ordenados) ordenados) ordenados) ordenados)


WA LT E R C É S P E D E S R A M Í R E Z

Según este coeficiente, los tres tipos de curtosis se dan, cuando:

K = (O7 – O5) + (O3 – O1) / (O6 – O2) < 1,237 (Se dice que la distribución es Platicúrtica) K = (O7 – O5) + (O3 – O1) / (O6 – O2) = 1,237 (Se dice que la distribución es Mesocúrtica) K = (O7 – O5) + (O3 – O1) / (O6 – O2) > 1,237 (Se dice que la distribución es Leptocúrtica)

En esta definición de curtosis, se dice que la distribución es normal si K = 1,237. Como los octiles (12,5%) representan la mitad de los cuartiles (25%), éstos no han tenido mucho uso en la estadística, por ello la fórmula es poco conocida. Se deja a criterio del lector el utilizar o no esta definición de curtosis, porque solo se ha propuesto para conocimiento del lector.

z2 8 3 z



L e c c i ó n

4

5.4. DESIGUALDAD Es una medida estadística de concentración, que mide el desequilibrio o desigualdad que pueda existir al relacionar la cantidad de datos o frecuencias que le corresponden a cada valor de la variable. Se denomina concentración de desigualdad a la mayor o menor equidad en el reparto de la suma total de los valores de la variable. Generalmente este tipo de medida, considera que su aplicación tiene utilidad, cuando la variable representa valores monetarios; por ejemplo: renta, salarios, inversiones, etc. Aunque el índice de concentración de desigualdad se utiliza sobre todo para medir la desigualdad en los ingresos, también puede utilizarse para medir la desigualdad en la riqueza suponiendo que nadie disponga de una riqueza neta negativa.

5.4.1. Formas de Concentración de Datos En la medición del grado de desigualdad, los valores extremos que se pueden dar dentro de una distribución de frecuencias sobre riquezas o sobre ingresos, son las concentraciones mínimas y las concentraciones máximas: Como se sabe, cuanto más se acerca a 1 el coeficiente de desigualdad, peor es la distribución del ingreso, en tanto que cuanto más se acerca a 0, es mejor. Así, un coeficiente igual a 1 sería sinónimo de la peor distribución posible, al significar que una sola persona se apropia de todo el ingreso, en tanto que uno igual a 0 reflejaría una perfecta distribución, pues indicaría que todos reciben una cantidad exactamente igual.

z2 8 5 z


E S TA D Í S T I C A I

Lógicamente, ambas situaciones extremas son utópicas, pues ninguna sociedad toleraría la primera, en tanto que dadas las diferentes: capacidades, habilidades, disposiciones y conductas humanas, resulta difícil aspirar a la segunda. Lo que se pretende es que el índice, dentro de los términos de la racionalidad, sea el más bajo posible. Según el Informe de Desarrollo Humano del año 2012, el Coeficiente de desigualdad medido con el coeficiente de Gini, Namibia tiene 0,707 (situación de máxima desigualdad), mientras que Dinamarca tiene 0,281 (situación de máximo reparto igualitario. De acuerdo a este informe, el Coeficiente de Gini de Brasil es 0,547; Chile 0,503; México 0,476; Argentina 0,411; Perú 0,481; Venezuela 0,390; China 0,474, Estados Unidos 0,469; Rusia 0,417; Portugal 0,345; Italia 0,319; Francia 0,305; España 0,340; Alemania 0,283; Suecia 0,244; Japón 0,321.

5.4.1.1. Concentración mínima Este caso extremo se da, cuando el conjunto total de valores de la variable, se encuentran repartidos por igual a cada uno de los valores; es decir, existe un reparto equitativo entre los datos siendo el coeficiente de desigualdad cero (0). Lo expresado se define de la siguiente manera: Sea la variable Xi con sus valores: X 1, X 2, X 3, X 4, ………. X n - 1 y X n. Se dice que existe concentración mínima, cuando lo valores: X 1 = X 2 = X 3 = X 4 = ………. = X n - 1 = X n = (Total ingresos / n)

5.4.1.2. Concentración máxima Este otro caso extremo se da, cuando el conjunto total de valores de la variable, no se encuentran repartidos, sino asignados al valor más alto; es decir, no existe un reparto equitativo entre los datos, porque no lo hay siendo el coeficiente de desigualdad uno (1). Lo expresado se define de la siguiente manera: Sea la variable Xi con sus valores: X 1, X 2, X 3, X 4, ………. X n - 1 y X n. Se dice que existe concentración mínima, cuando lo valores son: X 1 = X 2 = X 3 = X 4 = ………. = X n - 1 =

z2 8 6 z

0;

X n = Total ingresos


WA LT E R C É S P E D E S R A M Í R E Z

5.4.2. Definición de la Desigualdad Para medir el grado de desigualdad en la distribución de ingresos o de riquezas, existen una serie de índices disponibles, con propiedades distintas entre sí, tales como: los indicadores basados en función de la utilidad de Dalton y de Atkinson (1970), los indicadores basados en la entropía de Theil (1966), y los indicadores mayormente utilizados que miden la desigualdad de los ingresos de Gini y la curva de Lorenz. En principio ninguno de ellos es mejor que el otro; la utilidad de cada uno depende del uso que tenga para satisfacer las propiedades deseables en los indicadores de desigualdad que son: 1º Independencia de escala, porque el indicador no debe variar ante transformaciones proporcionales de los ingresos 2º Independencia de tamaño de la población, si se agrega un número proporcional de individuos a todos los niveles de ingreso, el índice no debe variar. 3º Independencia ante el cambio de posición, porque si los individuos intercambian posición, esto no debe afectar al indicador. 4º Principio de transferencia el indicador debe variar ante el cambio de individuos de una escala a otra y debe ser más fuerte si son extremas. 5º Descomposición aditiva, porque la concentración de ingresos para una población debe ser igual a la suma de la desigualdad inter-grupal e intra-grupal para los sub-grupos que la conforman. 6º Rango del índice, es deseable que éstos tengan como mínimo valor cero (0) y como máximo uno (1).

5.4.2.1. Índice de Gini Corrado Gini (Motta de Livenza, Treviso, Italia, 23 de Mayo de 1884, Roma, 13 de Marzo de 1965), fue desde joven un ejemplo de múltiples disciplinas. Estudió Matemáticas y Derecho en la Universidad de Bolonia y fue profesor de materias tan diversas como Estadística, Economía, Derecho, Biometría, Demografía y Sociología en las universidades de Cagliari, Luigi Boconi (Milán), Padua, Roma y Minnesota. Fue también responsable del departamento de estadística del Ministerio de la Guerra italiano durante la primera guerra mundial, miembro de la “Comisión para los problemas de la Postguerra”, director del Instituto Central de Estadística (1926.1932), colaborador de la Sociedad de Naciones y participó en varias expediciones de investigación antropológica-demográfica a diversas zonas del globo. Sus principales aportaciones científicas pertenecen al campo de la estadística: en la teoría de las distribuciones, en la estimación de parámetros en la medida del valor y márgenes de error de variables, medidas de variabilidad, etc. En el campo de la demografía prestó una atención especial a los fenómenos migratorios. Gini fue también un influyente teórico fascista e ideólogo que escribió Las bases científicas del fascismo en 1927. z2 8 7 z


E S TA D Í S T I C A I

El coeficiente de Gini es un número entre 0 y 1, en donde 0 se corresponde con la perfecta igualdad (todos tienen los mismos ingresos) y 1 se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno). El índice de Gini, es el coeficiente de Gini multiplicado por 100 para expresarlo en porcentaje, que es más fácil de comprender. El coeficiente de Gini se calcula como una razón de las áreas en el diagrama de la curva de Lorenz. Si el área entre la línea de perfecta igualdad y la curva de Lorenz es a, y el área por debajo de la curva de Lorenz es b, entonces el coeficiente de Gini es a / (a + b).

Este coeficiente es universalmente más utilizado por ser fácilmente comprensible, pese a no que tiene todas la propiedades deseables en un indicador de desigualdad; por ejemplo: no varía fuertemente en una fuerte transferencia de datos de una clase a otra, no responde a una descomposición aditiva, no es claro cuando al comparar dos indicadores las curvas de Lorenz se cruzan, y el peso de las transferencias es mayor en torno al centro de distribución. Según lo expresado, el coeficiente de Gini, se puede definir de la siguiente manera:

Donde: pi = fi / n

(Valor relativo (hi), frecuencia absoluta entre el número total de datos) .

qi = fi Xi / Σ fi Xi (Valor relativo del ingreso por clase o por individuo entre el ingreso total) Pi = Σ p i

(Valor relativo agregado o acumulado de pi).

Qi = Σ qi

(Valor relativo agregado o acumulado de qi).

Recuerde que los valores agregados son acumulaciones sucesivas que se van totalizando a partir de la primera clase, a medida pasa de una clase a otra; es decir, el valor acumulado a la segunda clase, será la suma de las dos primeras clase, el valor acumulado a la tercera clase, será la suma de las tres primeras clase, así sucesivamente

z2 8 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) Hallar el coeficiente y el índice de Gini utilizando los jornales por semana en soles: Jornales 455 465 fi

465 475

475 485

485 495

495 505

40

30

18

12

35

505 515 515 525 10

5

Solución: Jornales

fi

Xi

455

465

35

460

16 100

0,2333

0,2242

0,2333

0,2242

465

475

40

470

18 800

0,2667

0,2618

0,5000

0,4860

475

485

30

480

14 400

0,2000

0,2005

0,7000

0,6865

485

495

18

490

8 820

0,1200

0,1228

0,8200

0,8093

495

505

12

500

6 000

0,0800

0,0835

0,9000

0,8928

505

515

10

510

5 100

0,0667

0,0710

0,9667

0,9638

515

525

5

520

2 600

0,0333

0,0362

1,0000

1,0000

71 820

1,0000

1,0000

5,1200

5,0626

Σ (Total)

150

fi Xi

pi

qi

Pi

Qi

Coeficiente G = (5,12 – 5,0626) / (5,12 – 1) = 0,0139 Índice G = 0,0139 (100) = 1,39%

2) Hallar el coeficiente y el índice de Gini utilizando las siguientes estaturas en centímetros: Estaturas fi

135 145

145 155

155 165

15

25

45

165 175 175 185 65

25

185 195

195 205

20

5

Solución: Estaturas

fi

Xi

fi Xi

pi

135

145

15

140

2 100

0,075

145

155

25

150

3 750

0,125

155

165

45

160

7 200

165

175

65

170

11 050

175

185

25

180

185

195

20

190

195

205

5

200

Σ (Total)

200

qi

Pi

Qi

0,075

0,0629

0,1123

0,200

0,1752

0,225

0,2156

0,425

0,3908

0,325

0,3308

0,750

0,7216

4 500

0,125

0,1347

0,875

0,8563

3 800

0,100

0,1138

0,975

0,9701

0,0629

1 000

0,025

0,0299

1,000

1,0000

33 400

1,000

1,0000

4,300

4,1769

z2 8 9 z


E S TA D Í S T I C A I

Coeficiente G = (4,3 – 4,1769) / (4,3 – 1) = 0,0373 Índice G = 0,0373 (100) = 3,73%

3) Hallar el coeficiente y el índice de Gini utilizando los jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi

35

40

30

18

12

10

5

Solución: Jornales

fi

Xi

fi Xi

pi

qi

Pi

Qi

455

465

22

460

10 120

0,1467

0,1378

0,1467

0,1378

465

475

22

470

10 340

0,1467

0,1408

0,2904

0,2786

475

485

22

480

10 560

0,1466

0,1438

0,4400

0,4224

485

495

21

490

10 290

0,1400

0,1401

0,5800

0,5625

495

505

21

500

10 500

0,1400

0,1430

0,7200

0,7055

505

515

21

510

10 710

0,1400

0,1458

0,8600

0,8513

515

525

21

520

10 920

0,1400

0,1487

1,0000

1,0000

73 440

1,0000

1,0000

4,0371

3,9581

Σ (Total)

150

Coeficiente G = (4,0371 – 3,9581) / (4,0371 – 1) = 0,0260 Índice G = 0,0260 (100) = 2,60% En este ejercicio como usted habrá notado, las veces que se repiten los valores de la variable jornal, a pesar de que prácticamente iguales, el índice de Gini no es cero, es de 2,6%. Esto quiere decir que dentro de una distribución de datos, no es suficiente que a cada valor de la variable se reparta la misma cantidad de datos, sino que la proporción de los valores repartidos en su conjunto, sean los mismos en cada clase.

Resolver los siguientes ejercicios propuestos utilizando el Índice de Gini: 1) Hallar el índice de Gini de la siguiente distribución de datos: Calificación fi

Resp:

02

05 6

05

08 12

08

11 32

15,38%

z2 9 0 z

11

14 30

14

17 16

17

20 4


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar el índice de Gini de la siguiente distribución de datos: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

21

58

65

28

16

10

2

fi

Resp:

11,13%

3) Hallar el índice de Gini de la siguiente distribución de datos: Ventas (miles)

02

fi

Resp:

06

06

16

10

10

22

14

14

62

18

18

40

22

22

36

26 24

23,40%

4) Hallar el índice de Gini de la siguiente distribución de datos:

Personas

55

65

75

85

95

105

115

125

fi

24

26

28

28

26

30

26

12

Resp:

13,85%

5) Hallar el índice de Gini de la siguiente distribución de datos: Evaluación

02

fi

Resp:

05

05

16

08

08

18

11

11

32

14

14

36

17

17

12

20 6

18,90%

6) Hallar el índice de Gini de la siguiente distribución de datos: Sueldos

800

1 200

1 600

2 000

2 400

2 800

3 200

16

38

50

24

16

4

2

fi

Resp:

10,74%

7) Hallar el índice de Gini de la siguiente distribución de datos: Ventas (miles) fi

Resp:

12

16 20

16

20

20

24

16,17%

z2 9 1 z

24 26

24

28 20

28 32 16

32

36 14


E S TA D Í S T I C A I

8) Hallar el índice de Gini de la siguiente distribución de datos: Alumnos fi

Resp:

30

50

70

90

110

130

150

170

4

16

36

40

26

19

5

4

12,84%

9) Hallar el índice de Gini de la siguiente distribución de datos: Pensiones fi

800

850

900

950

1000

1050

1100

1150

4

16

36

40

26

19

5

4

Resp: 3,10%

5.4.2.2. Curva de Lorenz Max Otto Lorenz (1880 – 1962) economista estadounidense que desarrolló la curva de Lorenz en 1905 para describir las desigualdades del ingreso. Él publicó su estudio como estudiante del doctorado en la Universidad de Wisconsin en Madison, recibiendo el grado de doctor en 1906. La curva de Lorenz es una forma gráfica de mostrar la distribución de la renta en una población. En ella se relacionan los porcentajes acumulados de población con porcentajes acumulados de la renta que esta población recibe. En el eje de abscisas se representa la población “ordenada” de forma que los percentiles de renta más baja quedan a la izquierda y los de renta más alta quedan a la derecha. El eje de ordenadas representa las rentas. La línea negra representaría una distribución igualitaria de la renta.

En la gráfica se muestran como ejemplo la representación de dos países imaginarios, uno en azul y otro en rojo. La distribución de la renta en el país azul es más desigual que en el país rojo. En el caso del país azul, el cuarenta por ciento más pobre de la población recibe una renta inferior al veinte por ciento del total del país. En cambio, en el z2 9 2 z


WA LT E R C É S P E D E S R A M Í R E Z

país rojo, el cuarenta por ciento más pobre recibe más del veinte por ciento de la renta. La línea diagonal negra muestra la situación de un país en el que todos y cada uno de los individuos obtuviese exactamente la misma renta; sería la equidad absoluta. Cuanto más próxima esté la curva de Lorenz de la diagonal, más equitativa será la distribución de la renta de ese país. En la práctica si se grafican los valores de “P” en la abscisa y de “Q” en la ordenada, tomados del ´cálculo del coeficiente de Gini, se puede obtener la curva de Lorenz, por ello el lector si desea ver la variación de la desigualdad, puede graficarlos.

z2 9 3 z


E S TA D Í S T I C A I

AUTOEVALUACIÓN Nº 5 1) Hallar el cuarto momento con relación al origen de: 65 y 41 asistentes. A) 14 564 232,8

B) 17 937 669,2

C) 22 457 124,6

68, 81, 72, 56, 60, 54, 78, 55, D) 12 258 235,4

E) 10 158 247,5

2) Hallar el primer momento con relación al origen de: Remuneraciones

800

1 200

1 600

2 000

2 400

2 800

3 200

7

18

22

24

15

8

6

fi

A) 2 325

B) 1 762

C) 2 045

D) 1 880

E) 1 798

3) Hallar el tercer momento con relación a la media aritmética de: 458, 425, 462, 435, 452, 470, 482 y 484 participantes. A) – 2 465,625

B) – 3 145,200

C) 2 575,645

D) – 1 958,425

E) 2 470,500

4) Hallar el segundo momento con relación a la media aritmética de: Remuneraciones fi

A) 464 232

800

1 200

1 600

2 000

2 400

2 800

3 200

7

18

22

24

15

8

6

B) 456 789

C) 398 400

D) 388 354

E) 412 686

5) Hallar el primer coeficiente de asimetría de Pearson de la siguiente distribución de datos: Personas fi

A) – 14,25%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) – 16,63%

C) – 10,11%

D) – 3,88%

E) – 4,86%

6) Hallar el segundo coeficiente de asimetría de Pearson de la siguiente distribución de datos: Personas fi

A) – 17,24%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) – 28,73%

C) – 15,84%

z2 9 4 z

D) – 13,20%

E) – 14,24%


WA LT E R C É S P E D E S R A M Í R E Z

7) Hallar el coeficiente de asimetría de Fisher de la siguiente distribución de datos: Personas fi

A) 31,34%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) – 5,56%

C) 18,32%

D) – 33,25%

E) 26,58%

8) Hallar el coeficiente de asimetría de Bowley con cuartiles utilizando los siguientes datos: Personas fi

A) – 11,68%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) 1,26%

C) – 10,05%

D) – 7,85%

E) – 9,45%

9) Hallar el coeficiente de asimetría ampliado de Bowley con percentiles utilizando los siguientes datos: Personas fi

A) 8,20%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) 5,64%

C) – 4,24%

D) – 1,82%

E) 6,00%

10) Hallar el coeficiente de asimetría de Yule con cuartiles utilizando los siguientes datos: Personas fi

A) – 0,85%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) – 2,60%

C) 0,76%

D) – 1,08%

E) – 3,88%

11) Hallar el coeficiente de asimetría ampliado de Yule con percentiles utilizando los siguientes datos: Personas fi

A) – 3,22%

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) 12,16%

C) – 1,09% z2 9 5 z

D) 1,42%

E) – 3,33%


E S TA D Í S T I C A I

12) Hallar el coeficiente de curtosis de Fisher de la siguiente distribución de datos: Personas fi

A) 2,96

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) 3,64

C) 2,69

D) 3,56

E) 2,80

13) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Personas fi

A) 0,236

50 60

60 70

70 80

80 90

90 100

100 110

110 120

6

20

24

30

10

8

2

B) 3,045

C) 0,382

D) 0,333

E) 0,285

14) Hallar el índice de Gini de la siguiente distribución de datos: Sueldos en miles

8

fi

25

A) 12,57%

12

B) 15,52%

15) ¿Qué medida estadística horizontal? A) Asimetría

B) Curtosis

12 45

16 16 20 20 62 C) 23,56%

88

24 24

28 28

60

44

D) 7,18%

32 32 36 26

E) 16,22%

de concentración es conocida como medida de forma C) Momentos

D) Curva de Lorenz

E) Índice de Gini

Respuestas de control 1. B, 2. D, 3.A, 4. C, 5. B, 6. B, 7. A, 8. E, 9. E, 10. D, 11. D, 12. C, 13. A, 14. E, 15. A

z2 9 6 z


WA LT E R C É S P E D E S R A M Í R E Z

GLOSARIO Apuntamiento.

Se denomina así al nivel de punta que se puede observar en la altura de la mayor concentración de datos.

Asintóticamente normal.

Es el valor de “Y” infinitamente pequeño para cualquier valor de “X” pero nunca es cero. El modelo de probabilidad normal está contenido en la función de densidad de Gauss Y = f (X), que por tener su exponente con signo negativo, el valor de Y es asintóticamente normal.

Cola.

Son los pocos datos que quedan a los extremos a ambos lados de un conjunto ordenado de datos. Una de las colas puede ser más grande que la otra.

Demografía.

Ciencia encargada del estudio de poblaciones humanas.

Desviación.

Es la diferencia entre dos valores. En estadística es sinónimo de rango o de variación.

Entropía.

Indicador unidimensional. Perpendicular.

Es el desorden o la peculiaridad de ciertas combinaciones, es también considerada como una medida de la incertidumbre. La palabra entropía procede del griego “ἐντροπία” que significa “evolución o transformación”. Son indicadores cuya unidad de potencia es uno. Entiéndase como una línea imaginaria vertical trazada en forma paralela a la ordenada (Eje Y).

EXPLORACIÓN ON LINE http://books.google.com.pe/books?id=RbaC-wPWqjsC&pg=PA124&lpg=PA124&dq=estadistico+yule&source=bl&ots=WN9t5MG9s-&sig=y4u9XfGsLf8JuEFu2sH1KFCVsSI&hl=es#v=onepage&q&f=false http://www.unavarra.es/estadistica/I.T.A./Curso%202005-06/APUNTES/temas%201%20y%202.pdf http://es.wikipedia.org/wiki/Asimetr%C3%ADa http://www.spssfree.com/spss/analisis3.html http://nutriserver.com/Cursos/Bioestadistica/Asimetria_Curtosis.htm http://www.bioestadistica.uma.es/libro/node25.htm z2 9 7 z



s e x t a

UNIDAD Teoría de las Probabilidades

Teoría de conjuntos: operaciones, aplicaciones Teoría combinatoria: factorial,permutaciones, combinaciones Definición de las probabilidades: numérica, por axiomas, teoremas


OBJETIVO (S) GENERAL Aprender que a través de las técnicas para contar ya sea con permutaciones o con combinaciones, hallará el número de repeticiones posibles o espacio muestral y también las repeticiones favorables de un experimento aleatorio, que son utilizadas por las probabilidades, para conocer en qué medida se puede lograr lo esperado al relacionar lo favorable con el espacio muestral. Encontrar la utilidad de las probabilidades, ya que al ser aplicadas a una determinada variable, se puede determinar la certeza o incertidumbre de hallarla. Las probabilidades adquieren real importancia en la Estadística Inferencial por que la utiliza como base. ESPECÍFICOS • Conocer mediante los conjuntos las tres operaciones base, que son aplicadas directamente a las probabilidades. • Saber que con las técnicas para contar, se puede encontrar el número de variaciones posibles de “n” datos tomados en grupos definidos. • Puede definir el espacio muestral y calcular las probabilidades respectiva del suceso de una variable, a través de sus teoremas.


L e c c i ó n

1

6.1. TEORÍA DE CONJUNTOS

La teoría de Conjuntos es una herramienta importante para entender el comportamiento de las operaciones probabilísticas; por ejemplo el lector muchas veces tiene dificultad para entender cuando se tienen que sumar, restar o multiplicar las probabilidades cuando se asocian dos o más sucesos. Entre los conjuntos existen tres operaciones básicas relacionadas estrictamente con las probabilidades, tales operaciones son:

6.1.1. Operación de Unión ( ∪ )

z3 0 1 z


E S TA D Í S T I C A I

6.1.2. Operación de Intercepción ( ∩ )

6.1.3. Operación de Complemento ( ):

Ahora bien, considerando que las operaciones de conjuntos, son operaciones “o” (unión), operaciones “y” (intercepción) y operaciones “no” (complemento).

En probabilidades, también se consideran esas mismas opciones, que son:

a) Probabilidad de A unión B: P(AUB) Se lee como la probabilidad de A o B, y por lo tanto la operación a realizar será, la suma de la probabilidad de A más la probabilidad de B, menos la probabilidad de la intercepción de ambos sucesos (véase más adelante, 1,3,3. Teorema de la adición). b) Probabilidad de A intercepción B: P(A∩B) Se lee como la probabilidad de A y B, y por lo tanto la operación a realizar será la multiplicar la probabilidad de A por la probabilidad de B (véase más adelante, 1,3,4. Teorema de la multiplicación). c) Probabilidad del complemento de A: P(Ā) Se lee como la probabilidad de no A, y por lo tanto la operación a realizar será 1 menos la probabilidad de A (véase más adelante, 1,3,2. Teorema del complemento).

z3 0 2 z


WA LT E R C É S P E D E S R A M Í R E Z

El lector debe haber notado que las tres operaciones base de conjuntos, se aplican directamente a las probabilidades ya que en estas últimas solo caben las preguntas: ¿cuál es la probabilidad de A o B?, ¿cuál es la probabilidad de A y B?, y también la pregunta ¿cuál es la probabilidad de no A? Considerando la relación que existe entre Teoría de Conjuntos con Probabilidades, el lector sabrá que operaciones de aritmética realizar en el cálculo de probabilidades; ante las interrogantes ya expuestas, tal relación se resume de la siguiente manera: Relación entre la Teoría de Conjuntos con las Probabilidades Operación de Teoría de Conjuntos

Operación de Probabilidad

o

Suma

(∩)

y

Multiplicación

(Ā)

no

Unión

(U)

Intercepción Complemento

Lectura

z3 0 3 z

Resta de 1



L e c c i ó n

2

6.2. TEORÍA COMBINATORIA

Son procedimientos que se utilizan para determinar las veces que se puede presentar un grupo de elementos al ser seleccionados entre otros con determinadas características. Es un método práctico que se utiliza para conocer el número de resultados posibles de un experimento que puede ser aleatorio o al azar; es decir que esta teoría, es también aplicable a las probabilidades ya que con la teoría combinatoria se puede determinar las veces que se pude presentar un suceso al relacionarlo con su universo. Por ejemplo una gran empresa desea codificar a sus trabajadores para darles una identificación propia de acuerdo a la fecha de ingreso, para ello desea utilizar 2 letras y 2 dígitos. ¿Cuántos trabajadores pueden ser contratados, con reemplazo de la letra o del dígito ya seleccionado?

En el primer y segundo casillero pueden entrar desde la letra A hasta la Z (26); En el tercer y cuarto casillero pueden entrar desde el número 0 hasta el 9 (10). En caso de que la empresa no desee contar con el primer código AA00, entonces restaremos 1 a 67 600 y nos quedan 67 599 códigos posibles. También si las combinaciones de las dos letras, no deben estar acompañadas por dos ceros, entonces habrá que restar 676 (262) al total 67 600 y nos quedan 66 924 códigos disponibles. z3 0 5 z


E S TA D Í S T I C A I

¿Cuántos trabajadores pueden ser contratados, sin reemplazo de la letra o del dígito ya seleccionado?

En En En En

el el el el

primer casillero pueden entrar desde la letra A hasta la Z (26). segundo casillero pueden entrar solo las letras que quedan (25). tercer casillero pueden entrar los números desde el 0 hasta el 9 (10). cuarto casillero pueden entrar solo los números que quedan (9).

Tal como se ha observado, esta técnica para contar es bastante práctica además de los procedimientos formales que pueden ser utilizados para contar; tales procedimientos son:

6.2.1. Factorial (!) Es el producto de todos los números consecutivos que comienzan desde la unidad hasta el mismo número inclusive o viceversa, todo número factorial se escribe y se lee de la siguiente manera: (n !) Se lee factorial de n

n ! = n (n – 1) (n – 2) (n – 3)

… 2x1

Por excepción, el factorial de cero (0) es igual a 1, porque el valor mínimo del factorial de un número es siempre uno (1); no se considera el cero, ya que todo producto que considere al menos un cero, toda la respuesta es cero (0). Sepa que no existe factorial de un número negativo. Ejercicios resueltos 1) Hallar:

15!

Solución: 15! = 15 x 14 x 13 x 12 x 11 x 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 1 307 674 368 000 También se puede expresar: 15! = 15 x 14 x 13 x 12! 2) Hallar:

= 1, 307674368 x 1012

9!

z3 0 6 z


WA LT E R C É S P E D E S R A M Í R E Z

Solución: 9! = 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 362 880 También se puede expresar: 9! = 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 = 362 880 3) Hallar:

25!

Solución: 25! = 25 x 24 x 23 x 22 x 21 x 20 x 19 x 18 x 17! = 1,551121004x1025 La respuesta completa solo se puede expresar en forma científica, por el número resultante está compuesto por 26 cifras enteras.

Resolver los siguientes ejercicios propuestos sobre Factorial: 1) 5! + 4! - 1! Resp: 143 2) 10! - [9! + (7! X 3!)] Resp: 3 235 680 3) (3! + 5! + 6!) – (5! X 0!) Resp: 726 4) 4(2! + 8!) Resp: 161 288 5) 3(0! + 1!) - 3! Resp: 0 6) 10(8! + 4! – 6!) Resp: 396 240 7) 10[(8! – 5!) – (2! x 3! x 4! x 5!)] Resp: 56 400 8) 7! – (6! + 5!) Resp: 4 200 9) 8! / 8 x 7 Resp: 6! = 720 10) 12! / 10! Resp: 12 x 11 = 132

z3 0 7 z


E S TA D Í S T I C A I

6.2.2. Permutaciones (nPk) Es una técnica de conteo que se caracteriza por considerar siempre el orden en que se presentan los elementos o datos. Existe una variedad de permutaciones, por que acepta elementos que se encuentran repetidos y también elementos que una vez elegidos, pueden volver a ser utilizados en una nueva elección, reelegir un mismo objeto, se denomina con reemplazo. Entre las permutaciones más importantes, se pueden considerar:

6.2.2.1. Permutaciones sin elementos repetidos y sin reemplazo Se define de la siguiente manera: (nPk) = n! / (n – k)!

Ejercicios resueltos 1) ¿Cuántas permutaciones se pueden lograr si se desea premiar con: primer, segundo y tercer puesto a elección entre 10 vendedores? Solución: (10P3) = 10! / (10 – 3)! = 720 2) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 si se toman 4 dígitos con exclusión o sin reemplazo? Solución: (6P4) = 6! / (6 – 4)! = 360

6.2.2.2. Permutaciones sin elementos repetidos y con reemplazo Se define de la siguiente manera: (nPk) = nk

z3 0 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos 1) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 si se toman 4 dígitos con reemplazo? Solución: (6P4) = 64 = 1296 2) ¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, i; si se toman 3 letras con reemplazo? Solución: (9P3) = 93 = 729

6.2.2.3. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ser ubicados en línea Se define de la siguiente manera: (nPn) = n!

Ejercicios resueltos 1) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 sin reemplazo? Solución: (6P6) = 6! = 720 2) ¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, i; sin reemplazo? Solución: (9P9) = 9! = 362 880

z3 0 9 z


E S TA D Í S T I C A I

6.2.2.4. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ubicarlos en círculo: Se define de la siguiente manera: (nPn) =

(n – 1)!

Ejercicios resueltos

1) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 sin reemplazo para ubicarlos en círculo? Solución: (6P6) = (6 – 1)! = 120 2) ¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, i; sin reemplazo para ubicarlas en círculo? Solución: (9P9) = (9 – 1)! = 40 320

6.2.2.5. Permutaciones con elementos repetidos sin reemplazo tomando todos a la vez: Se define de la siguiente manera: (PR) = n! / (n1! n2! n3! …)

Ejercicios resueltos

1) ¿Cuántas permutaciones se pueden lograr con la palabra PAPA? Solución: P : n1 = 2 A : n2 = 2

n

(PR) = 4! / (2! x 2!) = 6

= 4 z3 1 0 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Hallar las permutaciones que se pueden lograr con la palabra ESTADÍSTICAS Solución: E: S: T: A: D: I : C:

n1 n2 n3 n4 n5 n6 n7 n

= 1 = 3 = 2 = 2 = 1 = 2 = 1 = 12

(PR) = 12! / (1! x 3! x 2! x 2! x 1! x 2! x 1!) = 9 979 200

3) Hallar las permutaciones que se pueden lograr con el número 515 517 Solución: 1 : n1 5 : n2 7 : n3 n

= = = =

2 3 1 6

(PR) = 6! / (2! x 3! x 1!) = 60

6.2.2.6. Permutaciones con restricciones Estas permutaciones pueden ser aplicadas a cualquiera de los casos vistos en la presente unidad y no se permite el uso de fórmulas, por que la solución depende de la restricción. En esta ocasión, solo se tratarán los casos de mayor uso, que son: 1ª CASO: Permutaciones con restricción sin elementos repetidos y sin reemplazo Ejercicios resueltos

1) ¿Cuántas permutaciones se pueden lograr si se desea premiar con: primer, segundo y tercer puesto a elección entre 4 vendedores mujeres y 6 hombres, si el primer premio le corresponde a una mujer?

Solución: Observe que la restricción está en el primer casillero y solo pueden participar cualquiera de las 4 vendedoras, pero se elige a una; para el segundo premio o casillero ya no hay restricción, por lo tanto pueden participar todos los que quedan entre hombres y mujeres (9); para la tercera y última elección, solo quedan 8 vendedores. z3 1 1 z


E S TA D Í S T I C A I

2) ¿Cuántos números pares de tres cifras se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 7 si se toma cada dígito sin reemplazo?

Solución: Observe que la restricción está en el último casillero, porque para que el conjunto sea par, solo basta que termine en cifra par, que son dos opciones (2 o 4); luego para la segunda elección ya no hay restricción y pueden participar cualquiera de los 5 dígitos restantes, finalmente el tercer dígito se elegirá entre los 4 que quedan. 2ª CASO: Permutaciones con restricción sin elementos repetidos y con reemplazo.

Ejercicios resueltos

1) ¿Cuántos números pares de tres cifras se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 7 si se toma cada dígito con reemplazo? Solución: Observe que la restricción está en el último casillero, y hay 2 opciones o 2 dígitos pares. 2) ¿Cuántos números de tres cifras menores de 500 se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 7 si se toma cada dígito con reemplazo? Solución:

Observe que la restricción está ahora en el primer casillero, y hay 4 opciones o 4 dígitos menores de 5 (1, 2, 3, 4); en las siguientes elecciones al no haber restricción y no se excluyen los dígitos elegidos, participan todos nuevamente (6).

Resolver los siguientes ejercicios propuestos sobre Permutaciones: 1) Hallar el número de permutaciones que se pueden logra con las letras a, b, c, d; si se toma 2 sin reemplazo. Resp: 12 2) Determine el número de formas en las cuales se pueden asignar 9 asistentes de docencia, a 9 secciones de un curso. Resp: 362 880 z3 1 2 z


WA LT E R C É S P E D E S R A M Í R E Z

3) Determine el número de formas en que se pueden clasificar 7 diseños de paquetes distintos de un nuevo producto, en orden de preferencia. Resp: 5 040 4) ¿De cuántas formas pueden 5 hombres y 4 mujeres pueden sentarse alrededor de una mesa circular, si no se impone ninguna restricción? Resp: 40 320 5) Desarrollar: Resp: 6 300

P2 x

6

P3

7

6) ¿De cuántas formas pueden sentarse 6 personas en un sofá, si tiene solamente tres asientos? Resp: 120 7) ¿De cuántas formas pueden ordenarse un estante 8 libros? si: (a) Es posible cualquier ordenación. (b) 3 libros determinados deben estar juntos. (c) 2 libros determinados deben ocupar los extremos.

Resp: 40 320 Resp: 4 320 Resp: 720

8) ¿Cuántos números diferentes se pueden lograr con: 3 veces 4, 4 veces 2 y 2 veces 3? Resp: 1 260 9) ¿Cuántos números de 3 cifras pueden formarse con los dígitos 1, 2, 3, 4 y 5 con reemplazo? Resp: 125 10) ¿De cuántas maneras pueden 8 personas sentarse en una mesa?: a) Si sabemos que solo alcanzan 5 personas en línea. Resp: 6 720 b) Si sabemos que solo alcanzan 5 personas en círculo* Resp: 1 344 (*) Este ejercicio sobre permutaciones, requiere de la ayuda de las combinaciones.

6.2.3. Combinaciones (nCk) Es una técnica para contar, que se caracteriza por no interesarse por el orden en que aparezcan lo objetos, demás en el proceso de elección debe hacerse sin reemplazo y los datos o elementos no deben estar repetidos. Las combinaciones se definen de la siguiente manera: (nCk) = n! / [ (n – k)! k! ]

z3 1 3 z


E S TA D Í S T I C A I

Ejercicios resueltos 1) Supóngase que un comité compuesto por 8 personas debe ser seleccionado entre un grupo de 20. ¿Por cuántos grupos distintos de personas puede constituirse el comité? Solución: C8 = 20! / [ (20 – 8)! x 8! ] = 125 970

20

2) En una realización de una conocida casa comercial, se ofertan 8 productos al mismo precio. A una persona le agradan todos los productos ofertados por igual y solo tiene dinero para 4 productos, ¿de cuántas maneras puede seleccionarlos? Solución: C4 = 8! / [ (8 – 4)! x 4! ] = 70

8

3) Si usted forma parte de un jurado calificador de un concurso de canto donde participan 10 concursantes con las mismas opciones de ganar, pero las normas del concurso puede aceptar hasta triple empate, porque solo puede otorgar 3 premios ¿de cuántas maneras puede seleccionar a 3 ganadores? Solución: C = 10! / [ (10 – 3)! x 3! ] = 120 10 3 Resolver los siguientes ejercicios propuestos sobre Combinaciones: 1) ¿Cuál de los números siguientes es mayor?: Resp: b

a)

C30

93

b)

C31

93

2) ¿De cuántas formas pueden seleccionarse 6 preguntas de un total de 10 para una evaluación? Resp: 210 3) Con 5 economistas y 6 administradores se quiere formar un directorio compuesto por 2 economistas y 3 administradores ¿Cuántos directorios diferentes pueden formarse si: a) No se impone ninguna restricción. Resp: 200 b) 2 administradores determinados deben estar en el directorio. Resp: 40 c) Uno de los administradores no debe estar en el directorio. Resp. 100 4) En cuántas formas se puede elegir un decano, si previamente se eligen de 2 de los 10 candidatos de la facultad de Administración de la UIGV. Resp: 90 5) ¿En cuántas formas pueden escogerse 4 interruptores buenos y 2 defectuosos de un lote que contiene 20 interruptores buenos y 5 defectuosos, si se sabe que todos los interruptores están codificados? Resp: 48 450 z3 1 4 z


WA LT E R C É S P E D E S R A M Í R E Z

6) Entre 8 hombres y 6 mujeres una profesora debe nombrar un comité compuesto por 4 alumnos. ¿Cuántos comités diferentes se pueden nombrar? Resp: 1 001 7) Un estudiante tiene que contestar 8 de 10 preguntas. Si las 2 primeras son obligatorias ¿de cuántas maneras podrá contestar? Resp: 28 8) Diez invitados a una cena se han dividido en 2 grupos de 5 porque hay 2 mesas con capacidad para 5. ¿De cuántas maneras diferentes se pueden agrupar los invitados? Resp: 252 9) ¿De cuántas formas puede un grupo de 10 personas dividirse en 2 grupos de 7 y 3 personas? Resp: 120 10) ¿De cuántas formas puede un grupo de 10 personas dividirse en 3 grupos de 4, 3 y 2 personas? Resp: 12 600

z3 1 5 z



L e c c i ó n

3

6.3. PROBABILIDADES

Toda probabilidad es un valor relativo o una proporción de sucesos llamados favorables, dentro de todos los sucesos posibles llamado espacio muestral. Tal valor relativo es el resultado de un experimento al azar o aleatorio, que se ocasiona cuando se relacionan todos los sucesos favorables de un experimento aleatorio o al azar, con todos los sucesos posibles del mismo experimento.

6.3.1. Definición numérica Numéricamente el valor de una probabilidad se obtiene al dividir el número de sucesos favorables, entre el espacio muestral (Ω) o número total de sucesos posibles. En muchos casos para determinar tanto el número de sucesos favorables como el posible, se recurre a la teoría combinatoria. P(A)

=

n (A) / n (Ω)

Ejercicios resueltos 1) ¿Cuál es la probabilidad de obtener 5 en el lanzamiento de un dado equilibrado? Solución: Ω = {1, 2, 3, 4, 5, 6}

n = 6

P(5) = 1 / 6 = 0,1667 (Porque hay un 5 entre 6 sucesos)

z3 1 7 z


E S TA D Í S T I C A I

2) ¿Cuál es la probabilidad de obtener un número menor de 3 en el lanzamiento de un dado equilibrado? Solución: Ω = {1, 2, 3, 4, 5, 6}

n = 6

P(<3) = 2 / 6 = 0,3333

(Porque hay 2 números menores de 3 entre 6 sucesos)

3) De un lote que contiene interruptores codificados, hay 20 buenos y 5 defectuosos ¿cuál es la probabilidad de que al elegir 6 interruptores, 4 sean buenos?

Solución: n = 20 + 5 = 25

k = 6

P(4 buenos y 2 defectuosos) =

20

C4 x 5C2 /

Ω =

C6 = 177100

25

C6 = 48450 / 177 100 = 0,2736

25

4) Con 9 consonantes y 6 vocales diferentes, ¿cuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y 2 vocales en un proceso sin reemplazo? Solución: n = 9 + 6 = 15

k = 5

P(3 consonantes y 2 vocales) =

C3 x 6C2 /

9

Ω =

C5 = 3003

15

C5 = 1260 / 3003 = 0,4196

15

Un problema de probabilidad sobre permutaciones se puede resolver por combinaciones.

Resolver los siguientes ejercicios propuestos considerando la Definición Numérica de Probabilidades: 1) Si se lanza una moneda 3 veces. Calcular la probabilidad de: a) Obtener un solo sello. Resp: b) No obtener sello. Resp:

0,3750 0,1250

2) Si se lanza un par de dados, ¿cuál es la probabilidad de obtener 2 números que sean consecutivos y ascendentes? Resp: 0,1389 3) Entre 8 hombres y 5 mujeres una profesora debe nombrar un comité compuesto por 4 alumnos. ¿Cuál es la probabilidad de que dicho comité quede integrado por? a) Un hombre. Resp: 0,1119 b) Al menos un hombre. Resp: 0,9930

z3 1 8 z


WA LT E R C É S P E D E S R A M Í R E Z

4) En un examen de Estadística un estudiante tiene que contestar 5 de 10 preguntas. ¿Cuál es la probabilidad de que un estudiante pueda contestar 5 preguntas, si las dos primeras son obligatorias? Resp: 0,2222 5) Diez invitados a una cena se han dividido en 2 grupos de 5 porque hay 2 mesas con capacidad para 5. ¿Cuál es la probabilidad de que dos invitados determinados, formen parte de la primera mesa? Resp: 0,2222

6.3.2. Definición por Teoremas Fácilmente se puede determinar que toda probabilidad por ser un valor relativo, el máximo valor posible es uno (1); es decir, espacio muestral (favorable) entre espacio muestral (posible). También se puede determinar que el mínimo es cero (0), cuando no hay sucesos favorables. Considerando lo visto, a continuación se definirán los siguientes teoremas relacionados con las probabilidades.

6.3.2.1. Teorema del conjunto vacío Cuando no existen sucesos favorables, la probabilidad de ocurrencia de dicho suceso es cero. P(ø) = 0

Ejercicios resueltos

1) Calcular la probabilidad de obtener 7 en el lanzamiento de un dado equilibrado. Solución: Ω = {1, 2, 3, 4, 5, 6} P(7) = 0 / 6 = 0

n = 6 (porque un dado no tiene 7)

2) ¿Cuál es la probabilidad de obtener 9 dentro de un conjunto de dígitos pares incluyendo al cero? Solución: Ω = {0, 2, 4, 6, 8}

n = 5

P(9) = 0 / 5 = 0

(por que el 9 es impar).

z3 1 9 z


E S TA D Í S T I C A I

Conociendo que todos los casos relacionados con este tipo de teorema la respuesta es cero, no se proponen más ejercicios sobre el conjunto vacío porque ya se sabe cuál es la respuesta.

6.3.2.2. Teorema del complemento La probabilidad de ocurrencia del complemento de un suceso cualquiera es igual a 1 menos la probabilidad de ocurrencia del propio suceso. P(Ā) = 1 – P(A)

Ejercicios resueltos

1) ¿Cuál es la probabilidad de no obtener As (A) al extraer una carta de una baraja de 52 cartas? Solución: Ω = {2♠, 2♣, 2♥, 2♦, 3♠, 3♣, 3♥, 3♦ …. K♠, K♣, K♥, K♦, A♠, A♣, A♥, A♦}

n = 52

P(A) = 4 / 52 = 0,0769 P(Ā) = 1 – P(A) = 1 – 0,0769 = 0,9231

2) Al ordenar sobre un estante 8 libros ¿cuál es la probabilidad de que 3 libros determinados no estén juntos? Solución: n=8

Ω = 8! = 40 320

P(3 libros juntos) = 6! x 3! / 8! = 4 320 / 40 320 = 0,1071 P

= 1 – 0,1071 = 0,8929

Resolver los siguientes ejercicios sobre el teorema del complemento de la Probabilidad 1) Si se lanza una moneda 3 veces, ¿cuál es la probabilidad de no obtener un solo sello? Resp: 0,6250

z3 2 0 z


WA LT E R C É S P E D E S R A M Í R E Z

2) Si se lanza un par de dados, ¿cuál es la probabilidad de no obtener 7 si se suman los resultados de ambos dados? Resp: 0,8333 3) Si se tienen 5 cubos identificados con las letras: A, B, C, D y E; si se ordenan dichos cubos sobre un estante, ¿cuál es la probabilidad de que la “B” no concluya el ordenamiento?

Resp:

0,8000

4) ¿Cuál es la probabilidad de que al ordenar las letras de la palabra PAPA, la “A” no esté al principio y la “P” no esté al final? Resp: 0,6666 5) En un internado con capacidad para 5 personas, hay igual número de camas ¿Cuál es la probabilidad de que al repartir las camas al azar, no ocupen los internos las camas alfabéticamente? Resp: 0,9917 6) Si en un estante hay 8 libros, ¿Cuál es la probabilidad de que 2 libros determinados no ocupen los extremos? Resp: 0,9821 7) Entre 10 hombres y 12 mujeres una profesora debe nombrar un comité compuesto por 5 alumnos. ¿Cuál es la probabilidad de que dicho comité no quede integrado solo por hombres? Resp: 0,9904 8) Doce invitados a una cena se han dividido en 2 grupos de 6 porque hay 2 mesas con capacidad para 6. ¿Cuál es la probabilidad de que dos invitados determinados, no formen parte de la primera mesa? Resp: 0,7727

6.3.2.3. Teorema de la adición Este teorema considera dos tipos de sucesos, que son: a) Eventos excluyentes

z3 2 1 z


E S TA D Í S T I C A I

Ejercicios resueltos

1) ¿Cuál es la probabilidad de obtener 2 o 5 en el lanzamiento de un dado equilibrado? Solución: Ω = {1, 2, 3, 4, 5, 6} P(2 o 5)

n = 6

= 1/6+1/6

= 2 / 6 = 0,3333

2) ¿Cuál es la probabilidad de obtener bola roja o bola blanca, al extraer una bola de una urna que contiene: 5 bolas rojas, 7 blancas y 8 azules? Solución: Ω = {R, R, R, R, R, B, B, B, B, B, B, B, A, A, A, A, A, A, A, A} P(2 o 5)

= 5 / 20 + 7 / 20

n = 20

= 0,25 + 0,35 = 0,6

b) Eventos no excluyentes o regla aditiva

Ejercicios resueltos

1) Calcular la probabilidad de obtener As (A) o corazón (♥) al extraer una carta de una baraja de 52 cartas. Solución: P

(A U B)

= P(A) + P(♥) - P(A ∩ ♥) ; P(A) = 4 / 52 ; P(♥) = 13 / 52 ; P(A ∩ ♥) = 1 / 52

P(As o corazón)

= 4 / 52 + 13 / 52 – 1 / 52 = 16 / 52 = 0,3077

z3 2 2 z


WA LT E R C É S P E D E S R A M Í R E Z

2) La probabilidad de que un hombre y una mujer pasen a semifinales en un concurso de matemáticas, es 0,4672. ¿Cuál es la probabilidad de que uno de los dos pase a semifinales, si las probabilidades individuales del hombre es de 0,6301 y la de la mujer es 0,7527? Solución: P

(H U M)

= P(H) + P(M) - P(H ∩ M) ; P(H) = 0,6301 ; P(M) = 0,7527 ; P(H ∩ M) = 0,4672

P(Hombre o Mujer)

= 0,6301 + 0,7527 – 0,4672 =

0,9156

Resolver los siguientes ejercicios propuestos sobre el Teorema de la adición de la Probabilidad: 1) Si se lanza una moneda 3 veces, ¿cuál es la probabilidad de obtener un solo sello o una sola cara? Resp: 0,7500 2) Para obtener una licencia de conducir es necesario aprobar el examen teórico como el práctico. Se sabe que la probabilidad de aprobar la teoría es 0.86, la parte práctica 0.72 y que se apruebe las 2 partes es de 0.78. Si se elige un alumno al azar. ¿Cuál es la probabilidad de que haya aprobado cualquiera de los exámenes para obtener licencia? Resp: 0,8000 3) Se tienen 5 cubos identificados con las letras: A, B, C, D y E; si se ordenan dichos cubos sobre un estante, ¿cuál es la probabilidad de que la letra “D” inicie el ordenamiento y la “B” lo concluya o viceversa? Resp: 0,1000 4) ¿Cuál es la probabilidad de obtener número par o mayor de 3 en el lanzamiento de un dado equilibrado? Resp: 0,6667 5) Si en un estante hay 8 libros, ¿Cuál es la probabilidad de que 2 o 3 libros cualesquiera estén juntos? Resp: 0,1429 6) Entre 8 hombres y 5 mujeres una profesora debe nombrar un comité compuesto por 4 alumnos. ¿Cuál es la probabilidad de que dicho comité quede integrado por dos hombres o por tres mujeres? Resp: 0,5035 7) Entre las escuelas de la facultad de administración, se conoce que el 53,25% desean graduarse recursos humanos, el 38,37% en Administración Logística y el 17,63% en ambas escuelas. Si se elige a un estudiante al azar de esta facultad, ¿cuál es la probabilidad de que desee graduarse en cualquiera de las escuelas mencionadas? Resp: 0,7399 z3 2 3 z


E S TA D Í S T I C A I

8) La probabilidad de que un estudiante universitario apruebe Estadística es de 12/15, de que apruebe Costos es de 6/8 y la probabilidad de que apruebe ambas asignaturas es de 0,6345. ¿Cuál es la probabilidad de que el alumno en mención apruebe Estadística o Costos? Resp: 0,9155

6.3.2.4. Teorema de la multiplicación Este teorema considera lo siguiente: a) Sucesos independientes Son aquellos por el cual la ocurrencia de uno de los sucesos, no va a afectar la ocurrencia de los demás sucesos. P(A ∩ B) = P(A) x P(B)

Ejercicios resueltos

1) Calcular la probabilidad de obtener bola roja y luego bola blanca con reemplazo de una urna que contiene 4 bolas rojas y 6 bolas blancas. Solución: Ω = {R, R, R, R, B, B, B, B, B, B} P(R ∩ B)

n = 10 bolas

P(R) = 4 / 10

P(B) = 6 / 10

= 4 / 10 x 6 / 10 = 24 / 100 = 0,24

2) La probabilidad de que un deportista especializado en tiro, de en el blanco es de 0,83. Si hace tres disparos. ¿Cuál es la probabilidad de dar en el blanco las tres veces? Solución: P(B ∩ B ∩ B)

= 0,83 x 0,83 x 0,83 = 0,5718

b) Sucesos dependientes Son aquellos por el cual la ocurrencia de uno de los sucesos, va a afectar la ocurrencia de los demás sucesos. P(A ∩ B) = P(A) x P(B/A) z3 2 4 z


WA LT E R C É S P E D E S R A M Í R E Z

Ejercicios resueltos

1) Calcular la probabilidad de obtener bola roja y luego bola blanca sin reemplazo de una urna que contiene 4 bolas rojas y 6 bolas blancas. Solución: n = 10 bolas

Ω = {R, R, R, R, B, B, B, B, B, B} P(R ∩ B)

P(R) = 4 / 10

P(B) = 6 / 10

= 4 / 10 x 6 / 9 = 24 / 90 = 0,2667

(Observe que la probabilidad de obtener bola blanca en segundo suceso ha cambiado, porque el espacio muestral también ha cambiado al retirar una bola sin reemplazo)

2) Se tienen 5 pilas de la misma marca de las cuales se conoce que 3 de ellas tienen carga eléctrica, si se eligen al azar 2 pilas consecutivamente (sin reemplazo). ¿Cuál es la probabilidad de que ambas pilas están cargadas? Solución: Ω = {P, P, P, , } P(P ∩ P)

n = 5

P(P) = 3 / 5

= 3 / 5 x 2 / 4 = 6 / 20 = 0,3

c) Probabilidad condicional Es cuando se espera la ocurrencia de un suceso conociendo el resultado de otro suceso que viene a ser el nuevo espacio muestral. P(B/A)

=

P(A ∩ B) / P(A)

Ejercicios resueltos

1) Calcular la probabilidad de obtener 3, en el lanzamiento de un dado equilibrado, si se sabe que el resultado fue impar. Solución: Ω = (Impar)

= {1, 3, 5}

n = 3

;

(Impar ∩ 3) = {3}

n = 1

P(3 / Impar) = 1 / 3 = 0,3333 (por que la condición impar es el nuevo espacio muestral)

z3 2 5 z


E S TA D Í S T I C A I

2) En una competencia de tiro, las probabilidades de dar en el blanco del deportista “A” es de 0,82 y la del deportista “B” es 0,76. Si cada uno decide hacer un solo disparo y uno de ellos ha dado en el blanco. ¿Cuál es la probabilidad de que haya sido el deportista “B”? Solución: P(A) = 0,82

P() = 1 – 0,82 = 0,18

P(B) = 0,76

P() = 1 – 0,76 = 0,24

P(Uno en Blanco) = P(A∩) o P(∩B) = (0,82 x 0,24) + 0,18 x 0,76) = 0,,3336 P(B ( Uno en Blanco)

= 0,18 x 0,76 / 0,3336 = 0,4101

Resolver los siguientes ejercicios propuestos sobre el Teorema de la multiplicación de la Probabilidad: 1) Una caja tiene 8 bolas rojas, 3 blancas y 9 azules. Hallar la probabilidad de que se extraiga una de cada color, en un proceso: a) Con reemplazo Resp: 0,1620 b) Sin reemplazo Resp: 0,1895 2) Un lote de 12 artículos tiene 4 defectuosos. Si se toman 3 artículos al azar uno tras otro. ¿Cuál es la probabilidad de que los 3 estén buenos? Resp: 0,2545 3) Un aula está compuesta por 15 alumnos jóvenes y por 20 adultos, si solo van a aprobar 18 alumnos, ¿cuál es la probabilidad de que entre los aprobados hayan 8 jóvenes y 10 adultos? Resp: 0,2620 4) Con 7 consonantes y 4 vocales diferentes, ¿cuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y dos vocales?, en un proceso de elección: a) Sin reemplazo Resp: 0,4545 b) Con reemplazo Resp. 0,3408 5) En una competencia de tiro dos competidores tiene las probabilidades de dar en el blanco de 0,8 y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que ambos disparos den en el blanco? Resp: 0,6000 6) En una competencia de tiro dos competidores tiene las probabilidades de dar en el blanco de 0,8 y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que uno solo de los competidores de en el blanco? Resp: 0,3500 7) En una competencia de tiro dos competidores tiene las probabilidades de dar en el blanco de 0,8 y 0,75; si cada uno hace un solo disparo y solo uno de ellos da en el blanco, ¿cuál es la probabilidad de que haya sido el primero? Resp: 0,5714. z3 2 6 z


WA LT E R C É S P E D E S R A M Í R E Z

8) Se tienen 5 pilas de la misma marca de las cuales se conoce que 3 de ellas tienen carga eléctrica, si se eligen al azar 3 pilas consecutivamente (sin reemplazo) y resulta que una no tiene carga eléctrica. ¿Cuál es la probabilidad de que la última pila extraída no tenga carga? Resp: 0,3333.

6.3.2.5. Teorema de la probabilidad total o de las particiones

Este teorema considera que si un suceso “A” se subdividiera en: A1, A2, A3, … An y posteriormente este mismo suceso fuera interceptado por otro suceso “B”; entonces cada subdivisión de “A” interceptada con “B”, quedaría de la siguiente manera: A1 ∩ B, A2 ∩ B, A3 ∩ B, …. An ∩ B. por consiguiente la probabilidad total de “B” es: P(B) = P(A1 ∩ B) + P(A2 ∩ B) + P(A3 ∩ B) + … + P(An ∩ B) P(B) = P(A1) P(B / A1) + P(A2) P(B / A2) + P(A3) P(B / A3) + … + P(An) P(B / An)

Ejercicios resueltos

1) La producción de una empresa procede de tres plantas de la siguiente manera: el 38% procede de la planta “A”, el 26% de la planta “B” y los restantes 36% proceden de la planta “C”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 5% y 8%; respectivamente. ¿Cuál es la probabilidad de que al elegir un producto al azar, éste sea defectuoso?

z3 2 7 z


E S TA D Í S T I C A I

Solución

P(D) = P(A ∩ D) + P(B ∩ d) + P(C ∩ D)

= P(A) P(D / A) + P(B) P(D / B) + P(C) P(D / C) =

P(D) = (0,38 x 0,03) + (0,26 x 0,05) + (0,36 x 0,08) = P(D) = 0,0114 + 0,0130 + 0,0288

= 0,0532

2) En una reunión de directorio se ha incluido en agenda incrementar las remuneraciones en general al 12%. La probabilidad de que asista el gerente general a la reunión de directorio quién sustentará dicho incremento, es de 0,92; si asiste el gerente general a dicha reunión, la probabilidad de que se apruebe el incremento, es de 0,84; en caso contrario, la aprobación del incremento será solo de 0,38. ¿Cuál es la probabilidad de que al término de la reunión del directorio la compañía apruebe incrementar las remuneraciones en 12%? Solución

P(A) = P(G ∩ A) + P( ∩A)

= P(G) P(A / G) + P() P(A /B)

P(A) = (0,92 x 0,84) + (0,08 x 0,38)

=

=

0,7728 + 0,0304 = 0,8032

3) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster, sénior y junior. El grupo máster está compuesto por el 26% de los trabajadores, el grupo sénior lo integran el 32% y el grupo junior los restantes 42%. Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. ¿Cuál es la probabilidad de que al elegir a un trabajador al azar, resulte ser mujer? z3 2 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Solución:

P(F) = P(M ∩ F) + P(S ∩ F) + P(J ∩ F)

= P(M) P(F / M) + P(S) P(F / S) + P(J) P(F / J) =

P(F) = (0,26 x 0,35) + (0,32 x 0,48) + (0,42 x 0,42) = P(F) = 0,0910 + 0,1536 + 0,1764

= 0,4210

En el ejercicio se ha identificado con una “F” a las mujeres por que la letra “M” ha sido reservada para el grupo máster.

4) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster, sénior y junior. El grupo máster está compuesto por el 26% de los trabajadores, el grupo sénior lo integran el 32% y el grupo junior los restantes 42%. Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. ¿Cuál es la probabilidad de que al elegir a un trabajador al azar, resulte ser hombre? Solución

P(H) = P(M ∩ H) + P(S ∩ H) + P(J ∩ H)

= P(M) P(H / M) + P(S) P(H / S) + P(J) P(H / J) =

P(H) = (0,26 x 0,65) + (0,32 x 0,52) + (0,42 x 0,58) = P(H) = 0,1690 + 0,1664 + 0,2436

= 0,5790

Conociendo que el grupo máster está compuesto por mujeres en 35%, se asume que los restantes trabajadores de ese grupo son hombres (65%). Lo mismo se ha hecho para determinar la proporción de hombres en los otros grupos. z3 2 9 z


E S TA D Í S T I C A I

Resolver los siguientes ejercicios propuestos sobre el Teorema de la probabilidad total: 1) Cuatro unidades realizan servicio de taxi en la ciudad de Lima a razón de: 15%, 28%, 34% y 23% al mes. Las probabilidades de que un usuario utilice este servicio por la cercanía a su domicilio, son: 0,18%, 0,13%, 0,20 y 0,14% respectivamente a cada unidad. ¿Cuál es la probabilidad de un día cualquiera este usuario tome una de estas unidades de taxi?

Resp:

0,1636

2) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. ¿Cuál es la probabilidad de que al elegir a un socio al azar, resulte ser hombre? Resp:

0,5610

3) La producción de una empresa procede de 4 plantas de la siguiente manera: el 26% procede de la planta “A”, el 24% de la planta “B”, el 22% de la planta “C” y los restantes 28% proceden de la planta “D”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 1,4% 2,5% y 1,8%; respectivamente. ¿Cuál es la probabilidad de que al elegir un producto al azar, éste sea defectuoso? Resp: 0,0217 4) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. ¿Cuál es la probabilidad de que al elegir a un socio al azar, resulte ser mujer?

Resp:

0,4390

5) La producción de una empresa procede de 5 plantas en proporciones iguales. Se sabe que la producción clase “A” de las 5 plantas, son: 73%, 85% 77%, 95% y 82%; respectivamente. ¿Cuál es la probabilidad de que al elegir un producto al azar, éste sea de clase “A”? Resp: 0,8240 6) En una reunión de consejo se ha incluido en agenda incrementar la remuneración mínima en 20%. La probabilidad de que el ministro de economía exponga claramente este incremento, es de 0,78; si su exposición es clara, la probabilidad de que se apruebe el incremento, es de 0,88; en caso contrario, la aprobación del incremento será solo de 0,22. ¿Cuál es la probabilidad de que al término del consejo de ministros se apruebe incrementar la remuneración mínima en 20%?

Resp:

0,7348

z3 3 0 z


WA LT E R C É S P E D E S R A M Í R E Z

7) Se lanza una moneda insesgada tres veces, cada vez que resulte cara se coloca en una urna una bola roja y se sale sello, se coloca una bola blanca. ¿Cuál es la probabilidad de extraer bola blanca si se saca una bola de la urna?

Resp:

0,5000

8) El servicio de transporte público de Lima está compuesto por: ómnibus (15%), microbús (32%), colectivo (8%) y taxi (45%). Los accidentes que ocasionan estas unidades de transporte son a razón de: 4%, 6%, 1% y 12% respectivamente. ¿Cuál es la probabilidad de en la ciudad de Lima se produzca un accidente ocasionado por el transporte público?

Resp:

0,0800

6.3.2.6. Teorema de la Bayes Este teorema considera una probabilidad condicional, desarrollada en el ambiente de la probabilidad total; por ello:

En donde las particiones al ser condición, se convierten en nuevo espacio muestral; por consiguiente, se busca hallar la probabilidad de una o más particiones que son consideradas como sucesos. Porque este teorema de la probabilidad se desarrolla en el ambiente de la probabilidad total, se utilizarán los mismos ejercicios anteriores sobre el teorema de las particiones, para ver cómo se aplica el teorema de Bayes. Ejercicios resueltos 1) La producción de una empresa procede de tres plantas de la siguiente manera: el 38% procede de la planta “A”, el 26% de la planta “B” y los restantes 36% proceden de la planta “C”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 5% y 8%; respectivamente. Si se elige un producto al azar y resulta defectuoso ¿cuál es la probabilidad de que provenga de la planta “A”? Solución:

z3 3 1 z


E S TA D Í S T I C A I

P(D) = P(A ∩ D) + P(B ∩ d) + P(C ∩ D)

= P(A) P(D / A) + P(B) P(D / B) + P(C) P(D / C) =

P(D) = (0,38 x 0,03) + (0,26 x 0,05) + (0,36 x 0,08) = 0,0114 + 0,0130 + 0,0288 = 0,0532 P(A / D) = P(A ∩ D) / P(D)

= 0,0114 / 0,0532 = 0,2143

2) En una reunión de directorio, se ha incluido en agenda incrementar las remuneraciones en general al 12%. La probabilidad de que asista el gerente general a la reunión para sustentar dicho incremento, es de 0,92; si asiste el gerente general, la probabilidad de que se apruebe el incremento, es de 0,84; en caso contrario, la aprobación del incremento será solo de 0,38. Al término de la reunión la compañía aprueba incrementar las remuneraciones en 12%, ¿cuál es la probabilidad de que el gerente haya asistido? Solución:

P(A) = P(G ∩ A) + P( ∩A)

= P(G) P(A / G) + P() P(A /B)

P(A) = (0,92 x 0,84) + (0,08 x 0,38) P(G / A) = P(G ∩ A) / P(A)

=

=

0,7728 + 0,0304 = 0,8032

= 0,7728 / 0,8032 = 0,9622

3) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster (26%), sénior (32%) y junior (42%). Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. Si elige a un trabajador al azar, resulta ser mujer, ¿cuál es la probabilidad de que sea máster o junior? Solución:

z3 3 2 z


WA LT E R C É S P E D E S R A M Í R E Z

P(F) = P(M ∩ F) + P(S ∩ F) + P(J ∩ F)

= P(M) P(F / M) + P(S) P(F / S) + P(J) P(F / J) =

P(F) = (0,26 x 0,35) + (0,32 x 0,48) + (0,42 x 0,42) = 0,0910 + 0,1536 + 0,1764 = 0,4210 P(M / F) = P(M ∩ F) / P(F) = 0,0910 / 0,4210 = 0,2162 P(J / F)

= P(J ∩ F) / P(F) = 0,1764 / 0,4210 = 0,4190

P(M ö J) = 0,2162 + 0,419 = 0,6352

4) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster (26%), sénior (32%) y junior (42%). Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. Si elige a un trabajador al azar, resulta ser hombre, ¿cuál es la probabilidad de que sea sénior? Solución:

P(H) = P(M ∩ H) + P(S ∩ H) + P(J ∩ H)

= P(M) P(H / M) + P(S) P(H / S) + P(J) P(H / J) =

P(H) = (0,26 x 0,65) + (0,32 x 0,52) + (0,42 x 0,58) = 0,1690 + 0,1664 + 0,2436

= 0,5790 P(S / H) =

P(S ∩ H) / P(H) = 0,1664 / 0,5790 = 0,2874

5) La producción de una empresa procede de cuatro plantas de la siguiente manera: el 28% procede de la planta “A”, el 26% de la planta “B”, el 22% procede de la planta “C” y los restantes 24% proceden de la planta “D”. Se sabe que la producción con fallas provenientes de las cuatro plantas, son: 0,8%, 0,5%, 1% y 0,4%; respectivamente. Si se elige un producto al azar y resulta tener fallas. Determine las probabilidades de que la falla provenga de cada planta.

z3 3 3 z


E S TA D Í S T I C A I

Solución:

P(F) = P(A ∩ F) + P(B ∩ F) + P(C ∩ F) + P(D ∩ F)

=

P(A) P(F / A) + P(B) P(F / B) + P(C) P(F / C) + P(D) P(F / D) = P(F) = (0,28 x 0,008) + (0,26 x 0,005) + (0,22 x 0,01) + (0,24 x 0,004) = P(F) =

0,00224 + 0,00130 + 0,00220 + 0,00096 = 0,0067

P(A / F) = P(A ∩ F) / P(F)

= 0,00224 / 0,0067 = 0,3343

P(B / F) = P(B ∩ F) / P(F)

= 0,00130 / 0,0067 = 0,1940

P(C / F) = P(C ∩ F) / P(F)

= 0,00220 / 0,0067 = 0,3284

P(D / F) = P(D ∩ F) / P(F)

= 0,00096 / 0,0067 = 0,1433

Resolver los siguientes ejercicios propuestos sobre el Teorema de Bayes: 1) Cuatro unidades realizan servicio de taxi en la ciudad de Lima a razón de: 15%, 28%, 34% y 23% al mes. Las probabilidades de que un usuario utilice este servicio por la cercanía a su domicilio, son: 0,18%, 0,13%, 0,20 y 0,14% respectivamente a cada unidad. Si un día cualquiera este usuario toma una de estas unidades de taxi, ¿cuál es la probabilidad de que sea la tercera? Resp: 0,4156 2) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. Si se elige a un socio al azar y resulta ser hombre, ¿cuál es la probabilidad de que sea niño? Resp: 0,2282 3) La producción de una empresa procede de 4 plantas de la siguiente manera: el 26% procede de la planta “A”, el 24% de la planta “B”, el 22% de la planta “C” y los restantes 28% proceden de la planta “D”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 1,4% 2,5% y 1,8%; respectivamente. Si se elige un producto al azar y es defectuoso, ¿cuál es la probabilidad de que provenga de la planta “B”? Resp: 0,1548 z3 3 4 z


WA LT E R C É S P E D E S R A M Í R E Z

4) El servicio de transporte público de Lima está compuesto por: ómnibus (15%), microbús (32%), colectivo (8%) y taxi (45%). Los accidentes que ocasionan estas unidades de transporte son a razón de: 4%, 6%, 1% y 12% respectivamente. Si en la ciudad de Lima se produce un accidente ocasionado por el transporte público, ¿cuál es la probabilidad de que dicho accidente lo causara un microbús? Resp: 0,2400 5) En una reunión de consejo se ha incluido en agenda incrementar la remuneración mínima en 20%. La probabilidad de que el ministro de economía exponga claramente este incremento, es de 0,78; si su exposición es clara, la probabilidad de que se apruebe el incremento, es de 0,88; en caso contrario, la aprobación del incremento será solo de 0,22. Al término del consejo de ministros se aprueba el incremento de la remuneración mínima en 20%, ¿cuál es la probabilidad de que la exposición del ministro no haya sido clara? Resp: 0,0659 6) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. Si se elige a un socio al azar y resulta ser mujer, ¿cuál es la probabilidad de que sea joven o niña? Resp: 0,3485 7) La producción de una empresa procede de 5 plantas en proporciones iguales. Se sabe que la producción clase “A” de las 5 plantas, son: 73%, 85% 77%, 95% y 82%; respectivamente. Si se elige un producto al azar y es de clase “A”, ¿cuál es la probabilidad de que provenga de la primera o segunda planta? Resp: 0,3835

z3 3 5 z


E S TA D Í S T I C A I

AUTOEVALUACIÓN Nº 6 1) Hallar las permutaciones que se pueden lograr con el número 1 515 517. A) 5 040 2) Resolver:

B) 210 P6 x

12

A) 139 708 800

C) 140

D) 180

E) 1800

P3.

7

B) 210 152 000

C) 665 280

D) 180 750

E) 25 180

3) ¿De cuántas maneras pueden 10 personas sentarse alrededor de una mesa con capacidad para 8 personas? A) 5 040

B) 1 814 400

C) 120

D) 180

E) 226 800

4) Un estudiante tiene que contestar 6 de 10 preguntas. Si la última pregunta es obligatoria, ¿de cuántas maneras podrá contestar? A) 210

B) 126

C) 151 200

D) 180

E) 800

5) Doce invitados a una cena va a ocupar 2 mesas, una con capacidad para 5 y la otra con capacidad para 7. ¿Cuántas maneras diferentes podrán agruparse en las mesas? A) 5 040

B) 792

C) 120

D) 180

E) 226

6) Un lote de 12 artículos tiene 3 defectuosos. Si se toman 3 artículos al azar uno tras otro. ¿Cuál es la probabilidad de que 2 estén buenos? A) 0,3818

B) 0,1406

C) 0,1846

D) 0,4909

E) 0,2524

7) Un aula está compuesta por: 20 jóvenes y 12 adultos, todos ellos con opciones iguales de aprobar una asignatura. Si solo van a aprobar 18 alumnos, ¿cuál es la probabilidad de que entre los aprobados haya 8 jóvenes y 10 adultos? A) 0,0176 B) 0,1006 C) 0,0816 D) 0,0009 E) 0,0522 8) Con 8 consonantes y 4 vocales diferentes, ¿cuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y 2 vocales en un proceso sin reemplazo? A) 0,0818 B) 0,0146 C) 0,1144 D) 0,0909 E) 0,4242 9) Si se lanza un par de dados, ¿cuál es la probabilidad de obtener 2 números que sean iguales o sean consecutivos ascendentes? A) 0,1666 B) 0,3333 C) 0,1846 D) 0,3056 E) 0,1388

z3 3 6 z


WA LT E R C É S P E D E S R A M Í R E Z

10) En una competencia de tiro dos participantes tiene las probabilidades de dar en el blanco de 0,68 y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que al menos, uno de los participantes den en el blanco? A) 0,51

B) 0,17

C) 0,92

D) 0,07

E) 0,02

11) La promoción de una escuela secundaria compuesta por 70 alumnos, entre las profesiones que escogieron en su mayoría de los egresados, fue: medicina y administración. Del total, 42 deseaban ser médicos, 37 deseaban ser administradores y 17 decían que querían ser médicos y administradores. Si al azar a un estudiante, ¿cuál es la probabilidad de que prefiera medicina o administración? A) 0,7858

B) 0,8857

C) 0,6846

D) 0,7588

E) 0,5788

12) La producción de una empresa procede de 4 plantas en proporciones iguales. Se sabe que la producción clase “A” de las 4 plantas, son: 93%, 88%, 95% y 90%; respectivamente. Si se elige un producto al azar, ¿cuál es la probabilidad de que no sea de clase A? A) 0,9150

B) 0,0850

C) 0,0949

D) 0,0758

E) 0,0570

13) El servicio de transporte público de Lima está compuesto por: ómnibus (15%), microbús (32%), colectivo (8%) y taxi (45%). Los accidentes que ocasionan estas unidades de transporte son a razón de: 4%, 6%, 1% y 12% respectivamente. Si en la ciudad de Lima se produce un accidente ocasionado por el transporte público, ¿cuál es la probabilidad de que dicho accidente lo causara un taxi? A) 0,7150

B) 0,5660

C) 0,6750

D) 0,7580

E) 0,7570

14) La producción de una empresa procede de 4 plantas de la siguiente manera: el 26% procede de la planta “A”, el 24% de la planta “B”, el 22% de la planta “C” y los restantes 28% proceden de la planta “D”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 1,4% 2,5% y 1,8%; respectivamente. Si se elige un producto al azar y no es defectuoso, ¿cuál es la probabilidad de que provenga de la planta “C”? A) 0,2193

B) 0,1879

C) 0,1949

D) 0,2298

E) 0,1577

15) Según su edad los socios inscritos en el club Regatas Lima, han sido clasificados como: adultos (58,5%), jóvenes (18,6%) y adolescentes (22,9%). Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. Si se elige a un socio al azar y resulta ser mujer, ¿cuál es la probabilidad de que no sea joven? A) 0,6667

B) 0,2774

C) 0,4402

D) 0,7719

E) 0,8786

Respuestas de control 1. C, 2. A, 3.E, 4. B, 5. B, 6. D, 7. A, 8. E, 9. D, 10. C, 11. B, 12. B, 13. C, 14. A, 15. D

z3 3 7 z


E S TA D Í S T I C A I

GLOSARIO Con Reemplazo.

La acción de devolver el elemento o dato elegido dentro de un todo, con el objeto de que vuelva a participar en la siguiente elección.

Se utiliza en los casos de que se requiera de la participación de un mismo dato varias veces.

Elementos Repetidos.

Existencia de datos u objetos dos o más veces con las mismas características.

Se utiliza en la permutación o ubicación de objetos en donde sobresalen aquellos que no están repetidos, ya que la variación de estos objetos repetidos no se aprecia.

Espacio Muestral.

Conjunto de todas las posibles ocurrencias contempladas en un Experimento Aleatorio.

Se utiliza como divisor en el cálculo de las probabilidades.

Experimento Aleatorio.

Proceso o acción que se encuentra sujeto al azar o a la suerte.

Se utiliza para conocer cuáles son las ocurrencias o sucesos posibles de alcanzar.

Probabilidad.

La división de un conjunto de observaciones llamadas favorables para una determinada acción, entre el número total de observaciones posibles para la misma acción. Se relaciona generalmente con procesos aleatorios de algún experimento.

Se utiliza para saber qué tan cerca o tan lejos se está de alcanzar lo que se busca ante una determinada acción, que puede estructurarse de la siguiente manera:

- 0,000

- 0,001 – 0,100: Incertidumbre sobre lo que se desea alcanzar

- 0,101 – 0,500:

Valor probable poco cierto

- 0,501 – 0,900:

Valor probable cierto

- 0,901 – 0,999:

Certeza sobre lo que se desea alcanzar

- 1,000

Certeza absoluta

:

:

Suceso imposible de alcanzar

Restricción.

Limitaciones para una acción o proceso.

Se utiliza para seleccionar objetos que tienen únicamente las características señaladas como restricción.

Sin Reemplazo.

La acción de no devolver el objeto elegido dentro de un todo, con el objeto de que no vuelva a participar en la siguiente elección. z3 3 8 z


WA LT E R C É S P E D E S R A M Í R E Z

Se utiliza solo en los casos de que se requiera de la participación de los datos que se tienen unas sola vez.

Suceso.

Cualquiera de las posibles ocurrencias en un experimento aleatorio, se le conoce también como evento.

Se utiliza como referencia para nombrar la ocurrencia de una determinada probabilidad que se espera alcanzar.

Sumatoria.

La suma de un conjunto de valores constantes y/o variables. Su símbolo es la letra griega mayúscula llamada sigma (Σ).

Se utiliza para agregar datos con el propósito de obtener cifras acumuladas, así como para establecer promedios al dividir lo acumulado entre el número de datos u observaciones.

Valor Aleatorio.

El producto del valor nominal de una variable por su respectiva probabilidad de ocurrencia.

Se utiliza en la Estadística Analítica o Inferencial, para calcular algunas medidas estadísticas, se diferencia de la Estadística Descriptiva, porque se obtiene lo mismo con solo conocer la variable y su probabilidad respectiva.

Valor Nominal.

El valor original de todo dato numérico constante o variable.

Se utiliza en la Estadística Descriptiva; porque al multiplicar el valor nominal por su respectiva frecuencia o veces que se repite el valor, permite calcular algunas medidas estadísticas.

EXPLORACIÓN ON LINE http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva http://www.aulafacil.com/CursoEstadistica/Lecc-16-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-18-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-22-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-25-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-26-est.htm

z3 3 9 z


E S TA D Í S T I C A I

BIBLIOGRAFÍA BÁSICA Berenson, Mark l. y David M. Levine (2000) Estadística Básica en Administración. Madrid, Prentice Hall Hispanoamérica S. A. Céspedes Ramírez, Walter (2011) Estadística II. Lima, Editorial Universidad Inca Garcilaso de la Vega Freud, E. John y otros (1993) Estadística para la Administración con enfoque Moderno. Madrid, Prentice Hall Hispanoamérica S. A. García Pérez, Alfonso (2008) Estadística Aplicada: Conceptos Básicos. Madrid, Universidad Nacional de Educación a Distancia (UNED). Kasmier, Leonard J. (2006) Estadística Aplicada a la Administración y a Economía. México, Mc Graw-Hill / Interamericana. Levine, Richard I. (2004) Estadística para Administración y Economía. 7ª. Ed. México, Prentice Hall Hispanoamérica S. A. Lind, Douglas y otros (2008) Estadística Aplicada a los Negocios y a la Economía. 13ª. Ed. Buenos Aires, Mc Graw-Hill / México, Interamericana. Martín Pliego, Francisco Javier y otros (2006) Problemas de Probabilidad. 2ª. Ed. Madrid, Thomson Paraninfo S. A. Newbold, Paul y William Carlson L. (2008) Estadística para Administración y Economía. Madrid, Prentice Hall Hispanoamérica S. A. Ricardo Cao, Abad y otros (2001) Introducción a la Estadística y sus Aplicaciones. Madrid, Pirámide. Ropero Morriones, Eva (2008) Manual de Estadística Empresarial (con Ejercicios Resueltos). Madrid, Delta Publicaciones Universitaria S. L. Tijero García, Ignacio. (2009) Estadística Práctica Aplicada a la Calidad: Fundamentos de la Calidad. Madrid, CYAN. Vilela Diez, Elizabeth (2001) Estadística Básica para Universitarios. Barañaín, Universidad de Navarra S. A. Webster, Allen L. (2000) Estadística Aplicada a los Negocios y la Economía. Santa Fe de Bogotá, Mc Graw Hill.

z3 4 0 z


WA LT E R C É S P E D E S R A M Í R E Z

BIBLIOGRAFÍA COMPLEMENTARIA Baíllo Moreno, Amparo (2007) 100 Problemas Resueltos de Estadística Multivariante. Madrid, Delta. Bonet Jerez, José Luis (2004) Lecciones de Estadística: Estadística Descriptiva y Probabilidad. Alicante, Club Universitario. Casas Sánchez, José Miguel y Julián Santos Peña (2002) Introducción a la Estadística para Administración y Dirección de Empresas 2ª Ed. Madrid, Universitaria Ramón Areces. Casas Sánchez, José Miguel (1999) Estadística Empresarial. Madrid, Universitaria Ramón Areces. Chao, Lincoln l. (1994) Estadística para Ciencias Administrativas. Santa Fe de Bogotá, Mc Graw Hill. Delgado de la Torre, Rosario (2007) Probabilidad y Estadística Para Ciencias e Ingeniería. Madrid, Delta. Fernández Fernández, Santiago y otros (2002) Estadística Descriptiva 2ª Ed. Madrid, ESIC Editorial. García Ramos González, Carmen y Gabriel Ruiz Garzón (2006) Estadística Administrativa. Cádiz, Universidad de Cádiz. Hernández Bautista, Agustín (2007) Curso Elemental de Estadística Descriptiva. Madrid, Pirámide. Hoel, Paul G. y Raymond J. Jensen (1986) Estadística Básica para los Negocios y para Economía, México D. F. Compañía Editorial Continental S. A. Mason, Robert D. y otros (2000) Estadística para Administradores. Madrid, Alfaomega S. A. Mendenhall, William (1990) Estadística para Administradores. Madrid, Grupo Editorial Iberoamericana. Mode, Elmer B. (2000) Elementos de Probabilidad y Estadística. México D. F., Reverte Mexicana S. A. Serrano Angulo, José (2003) Iniciación a la Estadística Bayesiana. Madrid, La Muralla. Vélez Ibarrola, Ricardo (2004) Cálculo de Probabilidades 2. Madrid, Ediciones Académicas. Zamora Sanz, Ana Isabel y otros (2006) Ejercicios de Estadística Descriptiva y Probabilidad para la Economía y Administración de Empresas. Madrid, Pirámid

z3 4 1 z



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.