1. ESTADÍSTICA DESCRIPTIVA
1.4. Métodos Tabulares y Gráficos
1.4.1. Tabulares 1.4.1.1. Tabla de Frecuencias 1.4.1.2. Distribución de Frecuencias 1.4.2. Gráficos 1.4.2.1. Histograma 1.4.2.2. Gráfico Circular ó de Pastel 1.4.2.3. Polígono de Frecuencias 1.4.2.4. Ojiva
1.4 Métodos Tabulares y Gráficos En éste apartado se presentan diversas técnicas para modificar o simplificar la información de los datos y que estos sean más manejables y se puedan usar para ayudar de manera más eficiente a quienes toman decisiones. Técnicas tales como la distribución de frecuencias, que no es más que una forma tabular de presentar un conjunto de datos, herramientas gráficas para resumir y representar datos, tales como histograma, polígono de frecuencias, ojiva, gráfico de pastel, y el Análisis Exploratorio de Datos que es una forma gráfica de poder realizar una inspección inmediata al comportamiento general de los datos de una población.
Vázquez, H. 2009
1
Datos No Agrupados: Se les llama así a los que son presentados sin procesar ó que no han sido resumidos en ninguna forma. Datos Agrupados: Son aquellos que se presentan ya resumidos y organizados por clases en forma tabular.
1.4.1. Tabulares 1.4.1.1. Tabla de Frecuencias:
cuando la variable es cuantitativa y la cantidad de datos no rebasa los 30 elementos, es posible realizar un tabular donde se pueda simplificar, siempre y cuando sea posible, la información del conjunto de datos; esto se da si se presenta cierta repetición de los datos, de tal modo que se pueda simplificar la información en dos columnas, en la primera irá el dato (X) y en la segunda la frecuencia (F) de éste, es decir el número de veces que se repita.
Cuando la variable es cualitativa el criterio es el mismo, es decir, la primera columna será el dato (X) y la segunda la frecuencia (F).
Ejemplo: La siguiente Tabla de Frecuencias muestra el número de hijos (X) de 20 familias que pertenecen a un club deportivo: X
F
0
2
1
4
2
9
3
4
4
1
Total
20
Como información complementaria para crear un marco de referencia más amplio sobre el comportamiento de la población, se consideran los siguientes conceptos en columnas adicionales a la tabla anterior:
Frecuencia Acumulada (Fa): son los datos menores o iguales a cada valor Frecuencia Relativa (Fr): es la razón de la frecuencia de cada dato respecto al total, es decir, la proporción que representa cada dato con respecto al total. Frecuencia Porcentual (%): es el porcentaje que representa cada dato del total del conjunto. Frecuencia Relativa Acumulada (Fra): son las frecuencias relativas menores ó iguales a cada valor.
Vázquez, H. 2009
2
Ejemplo: Realiza la Tabla de Frecuencias completa del número de hijos de las familias del club deportivo Agregando las columnas a la tabla anterior, tenemos:
X
F
Fa
Fr
%
Fra
0
2
2
2/20
10
2/20
1
4
6
4/20
20
6/20
2
9
15
9/20
45
15/20
3
4
19
4/20
20
19/20
4
1
20
1/20
5
1
Total
20
1
100
Nota: Observa que la frecuencia relativa está indicada como fracción, aunque también puede presentarse cómo decimal, toma en consideración que la frecuencia relativa y la frecuencia representan lo mismo, es decir la frecuencia porcentual es la frecuencia relativa indicada en porcentaje.
Ejemplo: La siguiente tabla muestra la preferencia de tiendas departamentales (X) para sus compras de un grupo de 50 personas de nivel medio:
X
F
Fr
%
Walmart
11
11/50
22
Chedraui
18
18/50
36
La Comercial
7
7/50
14
Soriana
8
8/50
16
Sam´s Club
6
6/50
12
Total
50
1
Nota: Observa que en Datos Cualitativos, no es importante el orden, por lo que en la tabla de Frecuencias las columnas de Fa y Fra no se consideran.
1.4.1.2. Distribución de Frecuencias: El ejemplo siguiente muestra la forma en que se puede organizar y clasificar la información de un conjunto de datos, hay que tomar en consideración que se realiza cuando el tamaño de dicho conjunto rebasa los 30 elementos. El criterio
Vázquez, H. 2009
3
Ejemplo: La siguiente Distribución de Frecuencias muestra los gastos publicitarios mensuales en miles de pesos (X) de 60 empresas fabricantes de papel en el estado de Jalisco.
CLASE (X)
F
(25 - 35]
5
(35 - 45]
10
(45 - 55]
21
(55 - 65]
16
(65 - 75]
8
Total
60
Notas:
Observa que los límites de clase inician con un paréntesis (intervalo abierto), esto indica que los datos que pertenecen a esa clase son mayores al límite inferior, y el corchete (intervalo cerrado) indica que los datos que pertenecen a la clase incluyen el límite superior.
Observa que no es materia de este curso la metodología para la construcción de la distribución de Frecuencias, aunque es importante conocer que el número de clases queda definido por el investigador, y normalmente son entre 5 y 15 clases, en función del número de datos y del rango (Dato mayor menos el Dato menor de la población: R =DM- Dm).
Al igual que para los datos no agrupados, la información que hay que agregar a la Distribución de Frecuencias para tener un marco de referencia más completo sobre la población son los siguientes conceptos:
Marca de Clase (V): ó valor medio, es un valor que representa a todos los datos de una clase y se obtiene como el promedio de los límites de cada clase:
Frecuencia Acumulada (Fa): son los datos menores o iguales al límite superior cada clase
Frecuencia Relativa (Fr): es la razón de la frecuencia de cada clase respecto al total, es decir, la proporción que representa cada clase con respecto al total de la población.
Frecuencia Porcentual (%): es el porcentaje que representa cada clase del total de la población.
Frecuencia Relativa Acumulada (Fra): son las frecuencias relativas menores ó iguales a cada límite superior.
Vázquez, H. 2009
4
Ejemplo: Realiza la Distribución de Frecuencias completa que muestra los gastos publicitarios mensuales en miles de pesos (X) de 60 empresas fabricantes de papel en el estado de Jalisco. Agregando las columnas a la tabla anterior, tenemos:
CLASE
F
V
Fa
Fr
%
Fra
(25 - 35]
5
30
5
5/60
8.33
5/60
(35 - 45]
10
40
15
10/60
16.67
15/60
(45 - 55]
21
50
36
21/60
35
36/60
(55 - 65]
16
60
52
16/60
26.67
52/60
(65 - 75]
8
70
60
8/60
13.33
1
1
100
Total
60
Nota: Observa que las Marcas de Clase (V), ahora se convierten en los nuevos datos de la población, es decir, por ejemplo, de la tabla anterior, podemos ver que hay 5 empresas que gastan 30 mil pesos mensuales.
1.4.2 Gráficos La forma más significativa de presentar la información es del modo gráfico, es la forma más simple de que el encargado de un estudio tenga un panorama general del comportamiento de una población y llegar a una conclusión con el simple hecho de observar su tabla y su gráfico. Uno de los usos más importantes de los gráficos es determinar la forma de una población. Las principales representaciones gráficas son:
1.4.2.1 Histograma Es un gráfico de barras, que se construye de la siguiente manera: Para Datos No Agrupados y Datos Cualitativos se pueden presentar las barras separadas, de modo que se determine un ancho estándar para cada uno de los datos en el eje X, y las alturas de las barras quedarán definidas por la frecuencia ( F, Fr ó %) de cada dato en el eje Y.
Vázquez, H. 2009
5
Ejemplos: La gráfica muestra el número de hijos que tiene un grupo de familias:
La gráfica muestra las tiendas departamentales que prefiere un grupo de personas:
Para datos agrupados, el esquema cambia un poco, necesariamente NO debe espacio entre barras, y queda construido como sigue: Las bases de las barras quedarás definidas en su extremo izquierdo por el límite inferior y el extremo derecho por el límite superior y las alturas quedarán definidas por las frecuencias de cada clase (F, Fr ó %)
Vázquez, H. 2009
6
Ejemplo: El gráfico nos muestra los gastos publicitarios mensuales en miles de pesos (X) de 60 empresas fabricantes de papel en el estado de Jalisco.
F, Fr, %: Número de empresas
HISTOGRAMA 20
15
10
5
0
25
35
45
55
65
75
X: Gastos Publicitarios
Vázquez, H. 2009
7
1.4.2.2. Gráfico Circular ó de Pastel Es un gráfico, como su nombre lo dice, circular que define en porciones a cada uno de los Datos ó Clases. Se pude realizar este tipo de gráfico para cualquiera de los datos (No Agrupados, Agrupados ó Cualitativos). En función de las frecuencias de cada Dato ó Clase, se define el tamaño de la porción. Obteniendo la proporción de cada clase, no es más que multiplicarla por 360° para determinar que sección le corresponde a cada dato ó clase. Es importante indicar el porcentaje que representa cada uno. Ejemplos:
Vázquez, H. 2009
8
1.4.2.3. Polígono de Frecuencias Es un gráfico de línea, que se construye de la siguiente manera: primero se trazan los puntos referentes al par de datos (X, Y) con los siguientes criterios:
Para el caso de Datos Agrupados: El trazo inicia colocando las Marca de Clase (V) en el eje de las X y la Frecuencia (F, Fr, %) en el eje de las Y, y se unen con líneas rectas; una característica del polígono de frecuencias es que debe cerrar con el eje de las X, por lo que es necesario, trazar 2 puntos adicionales, considerando una marca de clase anterior a la primera clase y una marca de clase posterior a la última, por lo que sus respectivas frecuencias serán 0.
NOTA: Observa que si sobrepones el polígono de frecuencias en el histograma, los puntos graficados coinciden con el punto medio de la parte superior de cada barra, por lo que, geométricamente, el área del polígono de frecuencias es la misma que el histograma, dado que hablamos de la misma población, de aquí la importancia de cerrar siempre el polígono con el eje de las X.
Vázquez, H. 2009
9
Para el caso de Datos No agrupados y Datos Cualitativos:
No es recomendable trabajar este tipo de gráfico, pues las áreas del polígono de frecuencias y el histograma no son las mismas.
1.4.2.4. Ojiva Es un gráfico de línea, exclusivo para datos cuantitativos, ya sea no agrupados ó agrupados al igual que el polígono de frecuencias, que se construye de la siguiente manera: Para el trazo de la ojiva coloque el Límite Superior de la clase (Ls) ó cada Dato en el eje de las X y la Frecuencia Acumulada (Fa, Fra) en el eje de las Y, y se unen con líneas rectas; una característica de la ojiva es que debe iniciar en el eje de las X, por lo que es necesario, trazar un punto adicional, considerando un marca de clase o un Dato anterior a la primera clase ó Dato, cuya frecuencia será 0. Ejemplo:
NOTA: Observa que la interpretación de la ojiva va relacionada con frecuencias acumuladas, es decir, se puede determinar hasta que valor ó al menos de que valor se encuentra determinado porcentaje de la población. La ojiva es gran ayuda para el cálculo gráfico de cualquier porcentaje de la población.
Vázquez, H. 2009
10