Organización de datos
Trabajo colaborativo – Organización de datos
Autor
GILMA ANGELICA GALVIS ORTIZ OSCAR JOSE JARAMILLO DOMNGUEZ
POLITÉCNICO GRANCOLOMBIANO
Bogotá, Noviembre 11 de 2012
Organización de datos
Las tablas de frecuencias son agrupaciones de los datos de una determinada base, se realizan con el fin de resumir la información para poder ser analizada, ya que viendo la base de datos completa no es posibles obtener información concreta, específicamente si son bases de datos muy grandes. Los graficas que podemos obtener de cada una de las tablas de frecuencias, también nos presentan en forma resumida los datos para cada variable. En el siguiente trabajo se presentan tablas de frecuencias y gráficos para los diferentes tipos de variables de la Encuesta de Hogares realizada por el Departamento Administrativo Nacional de Estadística (DANE), con el fin de implementar los conceptos vistos
Organización de datos
Método Selección de una hoja de la base de datos del archivo en Excel, determinando la población objeto de estudio y la muestra; para cada una de las variables presentadas se identifica la la clasificación de la variable y la escala de medida. Selección de una variable cuantitativa discreta, una cuantitativa continua y dos variables cualitativas y construcción de las tablas de frecuencias y los gráficos correspondientes con la ayuda de la hoja electrónica Excel.
Organización de datos
Resultados
1. Población objeto de estudio Hogares colombianos 2. Muestra Muestra formada por 633 hogares de estrato 2. 3. Clasificación de variables y escala
VARIACION Número de orden (NID) Número de personas en la familia (PE) Ingresos familiares anuales (ING) Gastos de alimentación anuales (AL) Gastos adicionales anuales (AD) Vivienda propia (V) Tiene automóvil (A) Tiene computador personal (O) Municipio (M)
CLASIFICACION ESCALA Cualitativa
Ordinal
Cuantitativa discreta Cuantitativa Continua Cuantitativa Continua Cuantitativa Continua Cualitativa Cualitativa Cualitativa Cualitativa
Razón Razón Razón Razón Nominal Nominal Nominal Nominal
4. Variables seleccionadas 4.1. Variable cuantitativa discreta – Número de personas en la familia Número de personas en la Número de Proporción familia hogares de hogares 1 118 18,600% 2 175 27,600% 3 162 25,600% 4 125 19,700% 5 46 7,300% 6 7 1,100% 633
Número acumulado de hogares 118 293 455 580 626 633
Proporción acumulada de hogares 18,600% 46,300% 71,900% 91,600% 98,900% 100,000%
Organización de datos
Frecuencias
Número de hogares 200 180 160 140 120 100 80 60 40 20 0 1
2
3
4
5
6
Numero de personas por hogar
PORCION DE HOGARES 1
2
3
4
5
6
1% 7%
19%
20% 28% 25%
El gráfico Número de hogares relaciona el número de personas por familia y la frecuencia con la que se presentan en la base de datos y el grafico proporción de hogares relaciona el número de personas por familia y la proporción de hogares que tienen determinado número de personas.
Organización de datos
En estos gráficos podemos observar que en los hogares de estrato 2 hay 2 o 3 personas en su mayoría, no muy lejos de los hogares que tienen 1 y 4 personas. También podemos notar que generalmente en este estrato no hay muchos hogares que se integren de 5 o 6 personas.
Proporción acumulada de hogares 1,200
Proporcion
1,000 0,800 0,600 0,400 0,200 0,000 1
2
3
4
5
6
Numero de personas por hogar
La proporción acumulada de hogares nos indica que hasta 4 personas por familia hay un acumulado de aproximadamente el 90% de los hogares, es decir el 90% de los hogares de estrato 2 se componen de hasta 4 integrantes.
Organización de datos
4.2. Variable cuantitativa continua – Gastos de alimentación anuales CONSTRUCCION DE LA TABLA 1 Máximo y Mínimo 10.694 6.367 10.694 - 6.367 4.327
Máximo = Mínimo = R= R=
2 Numero de intervalos o grupos m
m = 1 + 3.3 log 633 m = 10 3 Amplitud del rango 4.327 10 432,70
C= C= 4 Punto Medio Xi =
Gastos de Alimentación Anuales Li Ls 6.367,000 6.799,700 6.799,700 7.232,400 7.232,400 7.665,100 7.665,100 8.097,800 8.097,800 8.530,500 8.530,500 8.963,200 8.963,200 9.395,900 9.395,900 9.828,600 9.828,600 10.261,300 10.261,300 10.694,000
Gastos Medios Xi 6.583,350 7.016,050 7.448,750 7.881,450 8.314,150 8.746,850 9.179,550 9.612,250 10.044,950 10.477,650
Li + LS 2
Número de Hogares nj 8 39 72 130 148 127 65 30 8 6 633
Numero Proporción Proporción Acumulado Acumulada de Hogares de Hogares de Hogares hj Nj Hj 1,264% 8 1,264% 6,161% 47 7,425% 11,374% 119 18,799% 20,537% 249 39,336% 23,381% 397 62,717% 20,063% 524 82,780% 10,269% 589 93,049% 4,739% 619 97,788% 1,264% 627 99,052% 0,948% 633 100,000% 100,000%
Organización de datos
Numero de hogares
Frecuencia de hogares 160 140 120 100 80 60 40 20 0
gastos medios
En este grafico podemos ver que no hay un intervalo en el cual se agrupen en su mayoría los gastos de alimentación anuales. Podemos notar que se distribuyen en varios intervalos las diferentes familias, el grafico tiene la forma de una distribución normal y vemos que los gastos medios varían entre 7448,75 y 9179,55 para los hogares de estrato 2.
Numero de hogares
Poligono de frecuencias 160 140 120 100 80 60 40 20 0
Gostos medios
En el polígono de frecuencias se unen los puntos medios de los intervalos, y podemos notar, como en el grafico anterior, que esta variable tiende a distribuirse
Organización de datos
normal acumulando la mayoría de hogares entre los 3 intervalos que se encuentran entre 7665,1 y 8963,2 de gastos de alimentación anuales.
numero de hogares
Frecuencias acumuladas 700 600 500 400 300 200 100 0
Gastos medios
Con las frecuencias acumuladas y el de ojiva podemos observar que en aproximadamente el 90% de los hogares de estrato 2 gastan hasta 9179,55 en alimentación anualmente, son muy pocos los hogares de estrato 2 que gastan más de este dinero en alimentación anual.
Ojiva Numero de hogares
700 600 500 400 300 200 100 0
Gastos medios
Organización de datos
4.3. 4.4. Variables cualitativas: 4.4.1. Tiene automóvil
Tiene automóvil Número hogares % de hogares Si (1) 246 38,86% No (0) 387 61,14% Total 633 100%
Tiene automóvil 500 400 300 200 100 0 Si (1)
No (0)
En el histograma vemos que la mayoría de las familias en la muestra de estrato 2 no tienen carro.
% de hogares que tienen automóvil Si (1) 39% No (0) 61%
Organización de datos
En el grafico pastel podemos corroborar lo que nos dice el histograma de que la mayoría de las familias de estrato 2 en la muestra no tienen carro, acá además podemos ver que esa mayoría es un 61% 4.4.2. Vivienda propia
Vivienda propia Número hogares % de hogares Si (1) 404 63,82% No (0) 229 36,18% Total 633 100%
Vivienda propia 500 400 300 200 100 0 Si (1)
No (0)
La mayoría de familias en el estrato 2 de la muestra tienen vivienda propia, en el diagrama pastel podemos ver que el porcentaje de hogares en esta muestra que tienen vivienda propia es de 64%
% de hogares que tienen vivienda propia No (0) 36%
Si (1) 64%
Organización de datos
Lista de referencias
Moore, D. (2004) Estadística aplicada básica. Mozart Art, S.L.
Hopkins, K. Hopkins, B.R. Glass, G. (1997). Estadística básica para las ciencias sociales y del comportamiento. Tercera edición. Prentice Hall.