MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
ANÁLISIS E INTERPRETACIÓN DE SERIES COMPUESTAS O MUESTRAS GRANDES
30
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman ANÁLISIS E INTERPRETACIÓN DE
SERIES COMPUESTAS O MUESTRAS GRANDES (ORDENAMIENTO O ARREGLO DE DATOS PARA OBTENER SIGNIFCADOS: TABLAS Y GRÁFICAS)
Previo a desarrollar el análisis e interpretación de muestras grandes, conviene definir los siguientes conceptos:
Muestra Grande: Se identifica como muestras grandes a las series de datos que constan de al menos 30 elementos o más, es decir que “n” o “N” es igual o mayor a 30. Datos agrupados: es la técnica estadística que puede utilizarse con propiedad, para efectuar el análisis e interpretación de muestras grandes, y que consiste en agrupar los datos en distribuciones de frecuencias. Distribución de Frecuencias: Es el agrupamiento de los datos en intervalos o clases, puntos medios o marcas de clase y frecuencias de clase.
Tome como ejemplo el siguiente caso: Con el propósito de analizar la conveniencia de adquirir un seguro de vida colectivo, una empresa constructora ha obtenido los datos sobre las edades de todos sus trabajadores, los cuales se muestran a continuación:
32
29
25
35
28
29
33
25
22
29
24
28
24
23
23
29
20
21
21
25
19
28
28
28
38
30
29
34
29
24
20
24
33
22
24
26
22
25
22
21
20
20
22
23
28
20
21
21
23
26
24
21
23
30
32
26
23
22
21
28
26
29
22
27
26
24
34
36
23
21
24
33
26
22
20
21
32
22
29
27
27
25
22
23
24
30
26
26
26
26
30
22
26
31
39
27
37
37
25
27
23
32
24
Para que los datos sean útiles, necesitamos organizar las observaciones, de modo que se puedan distinguir patrones y llegar a conclusiones lógicas. La ordenación de datos es una de las formas más sencillas de presentarlos, se forman en orden ascendente o descendente. Los datos ordenados quedarían de la siguiente forma:
31
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
19
21
22
23
24
26
27
28
30
33
20
21
22
23
24
26
27
28
30
33
20
21
22
23
24
26
27
29
30
34
20
21
22
24
25
26
27
29
30
34
20
21
22
24
25
26
27
29
31
35
20
22
23
24
25
26
28
29
32
36
20
22
23
24
25
26
28
29
32
37
21
22
23
24
25
26
28
29
32
37
21
22
23
24
25
26
28
29
32
38
21
22
23
24
26
26
28
29
33
39
21
22
23
Luego, para construir la distribución de frecuencias, inicialmente debe calcularse el posible número de clases arreglos o intervalos, a través de la fórmula siguiente (Método de Stturges):
K = 1 + 3.33 (log n)
Para el ejemplo anterior sería:
K = 1 + 3.33 (log 103) K = 1 + 3.33 (2.0128) K = 1 + 6.7027 K = 7.7027
El valor obtenido al desarrollar la fórmula es el posible número de clases, intervalos o arreglos, en que se agruparán los datos. El paso siguiente es calcular la amplitud del intervalo según la fórmula siguiente:
i=
Donde:
es el valor más alto de la serie de datos es el valor más bajo de la serie de datos K es el posible número de clases obtenido al aplicar el método de Stturges
Sustituyendo valores se tendría:
32
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
.
i=
=
.
=
2.59
Nota: el valor obtenido en este paso siempre debe aproximarse al inmediato superior sin importar cuál sea el decimal que se obtenga. Por ejemplo si el valor hubiera sido: 2.00 el intervalo se queda en “2”; si el valor del decimal hubiera sido 2.01 o algún otro decimal se aproxima al inmediato superior “3”. Con base a los procedimientos realizados y los cálculos anteriores es factible proceder a la construcción de la distribución de frecuencias de la siguiente forma: Límites
Frecuencias
Puntos medios
Clases
Reales
(f)
(X)
19
-
21
18.5 - 21.5
16
20
22
-
24
21.5 - 24.5
30
23
25
-
27
24.5 - 27.5
22
26
28
-
30
27.5 - 30.5
19
29
31
-
33
30.5 - 33.5
8
32
34
-
36
33.5 - 36.5
4
35
37
-
39
36.5 - 39.5
4
38
La presentación anterior obedece a la forma como debe agruparse las frecuencias en cada intervalo, es decir, haciendo tarjas o marcas al identificarlos en los datos iniciales. De igual manera como se realizó con las series simples se calcularán primero las medidas de Tendencia Central (Media, Mediana y Moda) con la salvedad que para datos agrupados es posible emplear métodos diferentes, algunos de los cuales se utilizaran para efectos de ejemplificación del presente caso, con el objeto de proporcionar diferentes herramientas, entre las que se podrá elegir la que más se le facilita en el momento de realizar los análisis correspondientes.
Como un aspecto importante es necesario resaltar que en una distribución de frecuencias, los datos individuales pierden su identidad y son representados por los valores generales de frecuencia y puntos medios o marcas de clase, y por lo tanto las medidas de tendencia central o de dispersión que se calculen con base en dichos valores, pueden no corresponder al cien por ciento a los valores que se calculen utilizando los valores en forma individual, tal como se trabajaron en las series simples.
33
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
MEDIDAS DE TENDENCIA CENTRAL
Son los índices numéricos que proporcionan información sobre la tendencia de los datos a agruparse generalmente hacia una posición central, las medidas de tendencia central, que se estudiarán son: la media aritmética, la mediana y la moda.
Media Aritmética: Para el cálculo de la media aritmética puede utilizarse tres o más métodos, pero para efectos de estudio se verán únicamente dos métodos: el Básico o directo y el Indirecto.
Media Aritmética por el método básico o directo: Para utilizar éste método se hace necesario emplear la fórmula siguiente:
X =
∑ f. x ∑ f. x o X = ∑f n
Como puede notarse para utilizar ésta fórmula debe agregarse a la distribución de frecuencias, una columna de frecuencias por los puntos medios o marcas de clase (fx) y efectuar la sumatoria, de acuerdo con esto se procede de la siguiente manera:
Frecuencias
Puntos medios
Clases
(f)
(X)
fx
19
-
21
16
20
320
22
-
24
30
23
690
25
-
27
22
26
572
28
-
30
19
29
551
31
-
33
8
32
256
34
-
36
4
35
140
37
-
39
4
38
152
∑ =
103
∑=
Sustituyendo valores en la fórmula se tendría:
X =
2681 = 26.03 años 103 34
2681
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Media Aritmética por el método Indirecto: para aplicar este modelo se emplea la fórmula siguiente:
∑ f. d o n ∑ f. d X = A + ∑f
X = A +
Donde: A = media supuesta o falsa media d = diferencia de x con respecto a la media supuesta d=X-A
Nota: El valor a elegir como media supuesta o falsa media, puede ser cualquiera de los puntos medios o marcas de clase, para este caso en particular se utilizará el 29. La distribución de frecuencia quedará de la siguiente forma:
Frecuencias
Puntos medios
Clases
(f)
(X)
d
fd
19
-
21
16
20
20 – 29 = -9
- 144
22
-
24
30
23
23 – 29 = -6
- 180
25
-
27
22
26
26 – 29 = -3
- 66
28
-
30
19
29
29 – 29 = 0
0
31
-
33
8
32
32 – 29 = 3
24
34
-
36
4
35
35 – 29 = 6
24
37
-
39
4
38
38 – 29 = 9
36
∑ =
103
∑=
2681
∑ = - 306
Sustituyendo los valores en la fórmula tendríamos:
X = 29 +
− 306 = 29 + %−2.9709' = 29 − 2.9709 = 26.03 años 103
Cómo un aspecto importante cabe resaltar que con la utilización de éste método el cálculo es más rápido y como puede notarse el valor calculado es el mismo. Se agiliza más la ejecución de las operaciones al utilizar un valor supuesto como media aritmética y si se observa con detenimiento el valor de “d” donde se ubica la media supuesta, es cero y a partir de éste los valores de las diferencias, son crecientes positivos y negativos, en razón del tamaño del intervalo, y por lo tanto cercanos al origen.
35
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Mediana: El cálculo de la mediana para datos agrupados, puede hacerse a través de dos métodos los cuales son: Modelo matemático o de interpolación a través de formula y el Método gráfico.
Mediana por el modelo matemático o de interpolación a través de fórmula: Para utilizar este método es necesario recurrir a la fórmula siguiente: Donde: 12 = Mediana
= Límite Real inferior de la clase mediana 3, = Elemento mediano 2
n, − C / %i' m) = L + + 2 f.
C
= Frecuencia acumulada hasta la clase anterior
a
a la clase mediana
45 = Frecuencia de la clase mediana i = Amplitud del intervalo
Como puede notarse el primer paso para calcular la mediana a través del método matemático es encontrar la case mediana, para lo cual es necesario construir además de la distribución de frecuencia de clase, una columna de frecuencia acumulada así:
Límites
Frecuencias
Puntos medios
Reales
(f)
(X)
f.ac.
18.5 - 21.5
16
20
16
21.5 - 24.5
30
23
46
24.5 - 27.5
22
26
68
27.5 - 30.5
19
29
87
30.5 - 33.5
8
32
95
33.5 - 36.5
4
35
99
36.5 - 39.5
4
38
103
Fila Mediana
Para localizar la clase mediana se sigue el siguiente procedimiento: Se calcula el elemento mediano a través de n/2, por lo tanto: n/2 = 103 / 2 = 51.5. El siguiente paso es ubicar cual valor de la columna de frecuencias acumuladas contiene al valor obtenido, por simple observación se puede determinar que está en la tercera fila (donde ésta el 69, ya que este contiene el valor encontrado al operar el elemento mediano) motivo por el cual se define toda la fila como la “fila mediana”. Sustituyendo valores en la formula se tendría:
36
MANUAL DE ESTADÍSTICA
M) = 24.5 +
Lic. Johane Daniel Pérez Leberman
51.5 − 46 5.5 %3' = 24.5 + %3' = 24.5 + 0.25%3' = 24.5 + 0.75 = 25.25 22 22
El resultado anterior indica que el 50% de la información de la serie de datos son menores a 25.25 años y el 50% de la información de la serie de datos son mayores a éste valor.
Mediana por el método gráfico: Para poder llevar a cabo éste método se hace necesario utilizar el trazo de ojivas sobre las bases mayor que y menor que, el procedimiento es el siguiente:
Límites Reales
Ojiva menor que
Ojiva mayor que
18.5
0
103
21.5
16
87
24.5
46
57
27.5
68
35
30.5
87
16
33.5
95
8
36.5
99
4
39.5
103
0
Para completar el procedimiento se procede a ubicar los valores en un plano cartesiano situando los límites reales en el eje de las abscisas (x) y las frecuencias acumuladas en el de las ordenadas (y). La gráfica resultante estará conformada por dos líneas, una para la ojiva mayor que y los límites reales y la otra para la ojiva menor que y los límites reales.
En esta operación, se hace necesario observar el punto de intersección de ambas ojivas, trazando desde ahí hacia el eje de las “X” una línea perpendicular, el punto de encuentro entre dicha línea y el eje debe coincidir con el valor obtenido en el método matemático. El proceso concluido puede observarse en la figura siguiente:
37
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
120
100
80 Serie 1
60
Serie 2 40
20
0 18.5
21.5
24.5
25.25
27.5
30.5
33.5
36.5
39.5
Moda: Para efectos de estudio el valor de la moda será calculado a través de dos métodos: Método matemático o de interpolación y el Método gráfico.
Moda por el método matemático o de interpolación: Para éste método se necesita la fórmula siguiente:
Donde:
19 =
+
∆ %;' ∆ + ∆
19 = Moda
= Límite Real inferior de la clase modal
∆ = Incremento sub uno o frecuencia de la clase modal menos la frecuencia de la clase anterior a la clase modal ∆
= Incremento sub dos o frecuencia de la clase modal menos la
frecuencia de la clase posterior a la clase modal i = Amplitud del intervalo
Al igual que con los cálculos de la medida anterior, el primer paso para calcular la moda a través del método matemático es encontrar la fila que sirva de base para extraer los valores necesarios, dicha fila se conoce como fila modal o clase modal. La clase modal la constituye el intervalo o clase en donde se encuentre el mayor número de frecuencias, por lo tanto dentro de la distribución de frecuencia dicha fila sería:
38
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Límites
Frecuencias
Puntos medios
Reales
(f)
(X)
f.ac.
18.5 - 21.5
16
20
16
21.5 - 24.5
30
23
46
24.5 - 27.5
22
26
68
27.5 - 30.5
19
29
87
30.5 - 33.5
8
32
95
33.5 - 36.5
4
35
99
36.5 - 39.5
4
38
103
Clase Modal
Encontrada la clase modal el siguiente paso es sustituir los valores en la fórmula, quedando así:
m< = 21.5 +
%30 − 16' %14' %3' = 21.5 + %3' %30 − 16' + %30 − 22' %14' + %8'
m< = 21.5 +
14 %3' = 21.5 + %0.63636'%3' = m< = 23.41 22
Moda por el método gráfico: Para calcular la moda a través del método gráfico es necesario trazar un histograma o gráfico de barras con base en la distribución de frecuencias, situando los límites reales en el eje de las abscisas (x) y las frecuencias en el eje de las ordenadas (y).
El siguiente paso del procedimiento consiste en ubicar la barra con el mayor valor. Determinado lo anterior deberá trazar una diagonal que vaya desde la esquina de la barra anterior a la esquina superior opuesta (en la barra con más valores) repita el procedimiento con la barra posterior, trace una diagonal desde la esquina de dicha barra hasta la esquina superior opuesta.
En el punto de intersección de las diagonales trace una línea recta perpendicular hasta el eje “X”, el punto de encuentro entre la línea y el eje debe coincidir con el valor obtenido por el método matemático. El proceso concluido puede observarse en la figura siguiente.
39
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
35 30
Título del eje
25 20 15 10 5 0 18.5 - 21.5 21.5 - 24.5 24.5 - 27.5 27.5 - 30.5 30.5 - 33.5 33.5 - 36.5 36.5 - 39.5
23.41
Título del eje
MEDIDAS DE TENDENCIA DE DISPERSIÓN
Son los índices numéricos que proporcionan información sobre el grado de variación existente entre los valores de los datos de la serie objeto de estudio, las medidas de dispersión que se estudiarán son: rango o recorrido, varianza, desviación estándar, coeficiente de variación y coeficiente de oblicuidad.
Rango: El rango o recorrido puede calcularse por la fórmula siguiente:
R = L $ L Donde: L1 = Menor valor de la serie de datos L2 = Mayor valor de la serie de datos
R
39 $ 19
20 años
Lo que significa que existe una variación total (amplitud) en los valores de los datos de 20 años.
Varianza: Para efectos de estudio el valor de la varianza, para datos agrupados, será calculado a través de dos métodos: método básico o directo y el método indirecto.
Varianza por el método básico o directo: para realizar este modelo se debe emplear la formula siguiente:
40
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
S
∑ f(X $ X) n
Para este método debe construirse además de la distribución de frecuencia una columna de diferencias de X con respecto a la media aritmética quedando la distribución de la siguiente forma:
Clases
(f)
(X)
(? $ ?)
(? $ ?)@
A(? $ ?)@
19
-
21
16
20
20 – 26 = -6
36
576
22
-
24
30
23
23 – 26 = -3
9
270
25
-
27
22
26
26 – 26 = 0
0
0
28
-
30
19
29
29 – 26 = 3
9
171
31
-
33
8
32
32 – 26 = 6
36
288
34
-
36
4
35
35 – 26 = 9
81
324
37
-
39
4
38
38 – 26 = 12
144
576
∑ =
103
∑ = 2,205
Nota: para saber cuál es el valor de la columna x a seleccionar, para realizar las diferencias, se busca el valor que más se acerque a la media aritmética, para este caso: 26.03. Por lo tanto el valor más cercano es 26.
Sustituyendo los valores en la fórmula tendríamos:
S
2205 = 21.41 103
Varianza por el método indirecto: para realizar este modelo se debe emplear la formula siguiente:
Donde:
∑ f%d' ∑ f%d' / S = − + n n
d = diferencia de x con respecto a una supuesta d=x–A A = Media supuesta o falsa media
41
media
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Para utilizar la fórmula, es necesario adicionar a la distribución de frecuencia, tres columnas: una columna de diferencia de valores de x menos la media supuesta A, otra de f(d) y una última de f(d)². La distribución de frecuencia quedaría de la siguiente forma:
Clases
(f)
(X)
(B)
(B)@
A(B)
A(B)@
19
-
21
16
20
20 – 29 = -9
81
-144
1,296
22
-
24
30
23
23 – 29 = -6
36
-180
1,080
25
-
27
22
26
26 – 29 = -3
9
-66
198
28
-
30
19
29
29 – 29 = 0
0
0
0
31
-
33
8
32
32 – 29 = 3
9
24
72
34
-
36
4
35
35 – 29 = 6
36
24
144
37
-
39
4
38
38 – 29 = 9
81
36
324
∑ =
103
∑ = -306
∑ = 3,114
Nota: para saber cuál es el valor de la columna de valores de x a seleccionar, para realizar las diferencias, se busca el valor que este más centrado. Si existieran dos valores alrededor del centro se puede tomar el valor más alto.
Sustituyendo valores en la formula tendríamos:
S
3,114 −306 E = 30.23 − F−2.97G = 30.23 − F8.8209G = 21.41 − D 103 103
Cómo un aspecto importante cabe resaltar que con la utilización de éste método el cálculo es más rápido y puede notarse que el valor calculado es el mismo. Se agiliza la ejecución de las operaciones al utilizar un valor supuesto como media aritmética.
Desviación Estándar: En unidades lineales, proporciona información sobre el grado de variación existente entre los valores de los datos, sobre y bajo la media aritmética. Para el cálculo de esta medida, dependiendo del método utilizado para calcular la varianza, se pueden utilizar cualquiera de las siguientes fórmulas:
∑ f%X − X' ∑ f%d' ∑ f%d' / S = H S = H − + n n n
42
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Sustituyendo valores se tendría:
S
√21.41 = 4.63 S = √21.41 = 4.63
Coeficiente de Variación: El coeficiente de variación es una medida relativa que proporciona una estimación de la magnitud de la desviación con respecto a la magnitud de la media, expresando la desviación como porcentaje de la media aritmética. El cálculo de esta medida se puede efectuar por medio de la fórmula siguiente:
S 4.63 C. V. = x 100 = x 100 = 0.1779 x 100 = 17.79% 26.03 X Lo anterior significa que la desviación estándar representa el 17.79% de la magnitud de la media aritmética, visto en unidades lineales, esa sería la variación sobre y bajo la media aritmética de las edades de los trabajadores.
Coeficiente de Oblicuidad: Para calcular esta medida es necesario aplicar la siguiente fórmula:
C. O. =
3%X − m)' 3%26.03 − 25.25' 3%0.78' 2.34 = = = = 0.5054 S 4.63 4.63 4.63
El valor del coeficiente de oblicuidad indica que los valores de los datos tienden a agruparse más bajo que el valor de la media, es decir que hay mayor número de edades menores que la media y por lo tanto la distribución de los mismos está sesgada u oblicua hacia los valores mayores.
Resumen:
MN
26.03
19
23.41
12
25.25
R
20
O
21.41
S
4.63
C.V.
17.79%
C.O.
0.51
43
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Análisis e interpretación: De acuerdo con el valore de las medidas de tendencia central, es factible opinar que la edad de los trabajadores de esa empresa constructora, es muy favorable para viabilizar la contratación del seguro de vida colectivo, pues son valores cercanos (entre 23.41 y 26.03 años). Lo anterior quiere decir que es un grupo de edad joven en cuanto a su capacidad de producir y por lo tanto tendrán más de 30 años de vida productiva (visto desde las edades límites de la población económicamente activa de Guatemala, entre 14 y 55 años de edad).
Al observar las medidas de tendencia de dispersión se evidencia que el grado de variación alrededor de la media aritmética es de 4.63 años, de lo que se infiere que las edades máximas y mínimas esperadas, para aproximadamente el 85% de los trabajadores, son 21.4 años y 30.66 años, dicho de otra forma se está produciendo una variación del 17.8% lo que indica que las medidas de tendencia central son representativas en un 82.2% (100% - 17.8%) y por tanto válidas para sustentar una opinión.
En lo que respecta a la oblicuidad se puede decir que la forma que posee se ve influenciada por algunas edades altas, lo que hace que la distribución de los datos se sesgue o extienda a la derecha y es notorio que la mayor cantidad de datos se agrupa en valores menores a 25.25 años.
En conclusión se puede decir que la empresa está en una posición favorable para la contratación del seguro colectivo, puesto que las expectativas de vida productivas son altas en ese grupo de trabajadores.
Laboratorio # 3
1)
Servicios turísticos “El Viajero” transporta turistas por los departamentos del noroccidente del país. Su propietario requiere de una estimación del tiempo que el INGUAT tarda en autorizar una solicitud para ampliación de rutas. Él ha conseguido información sobre los tiempos promedio de espera de las últimas 50 solicitudes (la información está en días que tarda la solicitud). La información es la siguiente: 34
23
31
25
47
44
38
33
26
27
29
31
34
38
37
24
37
32
34
41
29
28
51
44
47
44
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
40
28
40
33
32
34
31
42
35
31
40
30
31
35
33
44
39
36
36
39
22
44
31
28
31
Con esta información se le solicita: a) b) c) d) e) 2)
Ordene los datos adecuadamente Determine las medidas de Tendencia Central y de Tendencia de Dispersión Grafique la información obtenida Realizar un análisis verídico de los índices numéricos obtenidos Oriente al propietario sobre que esperar del tiempo que tardara su solicitud
Una fábrica del altiplano produce alfombras decorativas, las que vende en los distintos mercados cantonales del país. Para efectos de investigación se ha tomado una muestra de 30 telares, las medidas son como sigue:
16.2
15.8
15.2
16.8
15.6
16.1
15.7
16.8
15.7
15.9
16.9
15.9
16.4
16.0
16.6
16.3
15.6
16.0
15.4
16.3
15.8
15.9
16.0
15.6
16.4
16.0
16.2
15.9
15.8
16.3
Se le solicita lo siguiente: a) Determinar las medidas de Tendencia Central y de Dispersión b) Construir una distribución de frecuencia para graficar un Histograma y un Polígono de frecuencia c) Analice la información obtenida en los índices numéricos y oriente al propietario sobre la tendencia de las medidas de las alfombras 3)
Con el propósito de hacer una evaluación de desempeño y ajuste de cuotas el gerente de una venta de autos inspecciono las ventas de 40 concesionarios. En un mes tuvieron las siguientes ventas:
7
8
5
10
9
10
5
12
8
6
10
11
6
5
10
11
10
5
9
13
8
12
8
8
10
15
7
6
8
8
5
6
9
7
14
8
7
5
5
14
Se le solicita lo siguiente:
45
MANUAL DE ESTADÍSTICA a) b) c) d)
4)
Lic. Johane Daniel Pérez Leberman
Construir una distribución de frecuencia Calcular las medidas de tendencia central y de dispersión (por los tres métodos) Graficas las gráficas correspondientes a Media y Moda Cómo le recomendaría que ajuste las cuotas de ventas de autos si las ventas menores a 7 autos por mes son consideradas como inaceptables
El gerente general de la agencia de viajes “Hasta aquí Y-gaste” realiza una investigación sobre los precios de los servicios que presta a las distintas regiones del país, con los siguientes resultados:
250
265
250
290
238
260
248
270
232
275
262
262
240
270
272
236
263
258
248
254
280
263
246
236
288
254
270
263
265
240
270
280
260
250
246
260
284
290
272
268
230
300
284
240
254
258
296
278
280
278
Se le pide: a) b) c) d)
5)
Elaborar una distribución de frecuencia Determine las medidas de Tendencia Central y de Dispersión Realizar un Histograma y un Polígono de Frecuencia Analice la información tomando en consideración que los precios inferiores a $270 representan más gastos organizativos para la empresa
El gerente de la agencia de viajes “Clark Tours” está pensando en lanzar una campaña publicitaria, con el fin de atraer a un mayor número de compradores de paquetes “Guatemala alma del Mundo Maya” pero no tiene muy claro a qué público debe enfocarse. A continuación se le presentan las edades de las personas que compraron esa clase de paquetes el mes pasado. La información es la siguiente:
26
37
40
18
14
45
32
68
31
37
20
32
15
27
46
44
62
58
30
42
22
26
44
41
34
55
50
63
29
22
Con esa información se le solicita: a) Crear una Distribución de Frecuencia b) Establecer las medidas de Tendencia Central c) Establecer las medidas de Tendencia de Dispersión d) Crear el Histograma y el Polígono de Frecuencia respectivo e) Dar una respuesta concreta al problema del gerente de la agencia de viajes f) Establecer el valor del Cuartil 3, Decil 8 y Percentil 63
46