Proyecto I de estadistica

Page 1

Organización de datos

Trabajo colaborativo – Organización de datos

Autor

GILMA ANGELICA GALVIS ORTIZ OSCAR JOSE JARAMILLO DOMNGUEZ

POLITÉCNICO GRANCOLOMBIANO

Bogotá, Noviembre 11 de 2012


Organización de datos

Las tablas de frecuencias son agrupaciones de los datos de una determinada base, se realizan con el fin de resumir la información para poder ser analizada, ya que viendo la base de datos completa no es posibles obtener información concreta, específicamente si son bases de datos muy grandes. Los graficas que podemos obtener de cada una de las tablas de frecuencias, también nos presentan en forma resumida los datos para cada variable. En el siguiente trabajo se presentan tablas de frecuencias y gráficos para los diferentes tipos de variables de la Encuesta de Hogares realizada por el Departamento Administrativo Nacional de Estadística (DANE), con el fin de implementar los conceptos vistos


Organización de datos

Método Selección de una hoja de la base de datos del archivo en Excel, determinando la población objeto de estudio y la muestra; para cada una de las variables presentadas se identifica la la clasificación de la variable y la escala de medida. Selección de una variable cuantitativa discreta, una cuantitativa continua y dos variables cualitativas y construcción de las tablas de frecuencias y los gráficos correspondientes con la ayuda de la hoja electrónica Excel.


Organización de datos

Resultados

1. Población objeto de estudio Hogares colombianos 2. Muestra Muestra formada por 633 hogares de estrato 2. 3. Clasificación de variables y escala

VARIACION Número de orden (NID) Número de personas en la familia (PE) Ingresos familiares anuales (ING) Gastos de alimentación anuales (AL) Gastos adicionales anuales (AD) Vivienda propia (V) Tiene automóvil (A) Tiene computador personal (O) Municipio (M)

CLASIFICACION ESCALA Cualitativa

Ordinal

Cuantitativa discreta Cuantitativa Continua Cuantitativa Continua Cuantitativa Continua Cualitativa Cualitativa Cualitativa Cualitativa

Razón Razón Razón Razón Nominal Nominal Nominal Nominal

4. Variables seleccionadas 4.1. Variable cuantitativa discreta – Número de personas en la familia Número de personas en la Número de Proporción familia hogares de hogares 1 118 18,600% 2 175 27,600% 3 162 25,600% 4 125 19,700% 5 46 7,300% 6 7 1,100% 633

Número acumulado de hogares 118 293 455 580 626 633

Proporción acumulada de hogares 18,600% 46,300% 71,900% 91,600% 98,900% 100,000%


Organización de datos

Frecuencias

Número de hogares 200 180 160 140 120 100 80 60 40 20 0 1

2

3

4

5

6

Numero de personas por hogar

PORCION DE HOGARES 1

2

3

4

5

6

1% 7%

19%

20% 28% 25%

El gráfico Número de hogares relaciona el número de personas por familia y la frecuencia con la que se presentan en la base de datos y el grafico proporción de hogares relaciona el número de personas por familia y la proporción de hogares que tienen determinado número de personas.


Organización de datos

En estos gráficos podemos observar que en los hogares de estrato 2 hay 2 o 3 personas en su mayoría, no muy lejos de los hogares que tienen 1 y 4 personas. También podemos notar que generalmente en este estrato no hay muchos hogares que se integren de 5 o 6 personas.

Proporción acumulada de hogares 1,200

Proporcion

1,000 0,800 0,600 0,400 0,200 0,000 1

2

3

4

5

6

Numero de personas por hogar

La proporción acumulada de hogares nos indica que hasta 4 personas por familia hay un acumulado de aproximadamente el 90% de los hogares, es decir el 90% de los hogares de estrato 2 se componen de hasta 4 integrantes.


Organización de datos

4.2. Variable cuantitativa continua – Gastos de alimentación anuales CONSTRUCCION DE LA TABLA 1 Máximo y Mínimo 10.694 6.367 10.694 - 6.367 4.327

Máximo = Mínimo = R= R=

2 Numero de intervalos o grupos m

m = 1 + 3.3 log 633 m = 10 3 Amplitud del rango 4.327 10 432,70

C= C= 4 Punto Medio Xi =

Gastos de Alimentación Anuales Li Ls 6.367,000 6.799,700 6.799,700 7.232,400 7.232,400 7.665,100 7.665,100 8.097,800 8.097,800 8.530,500 8.530,500 8.963,200 8.963,200 9.395,900 9.395,900 9.828,600 9.828,600 10.261,300 10.261,300 10.694,000

Gastos Medios Xi 6.583,350 7.016,050 7.448,750 7.881,450 8.314,150 8.746,850 9.179,550 9.612,250 10.044,950 10.477,650

Li + LS 2

Número de Hogares nj 8 39 72 130 148 127 65 30 8 6 633

Numero Proporción Proporción Acumulado Acumulada de Hogares de Hogares de Hogares hj Nj Hj 1,264% 8 1,264% 6,161% 47 7,425% 11,374% 119 18,799% 20,537% 249 39,336% 23,381% 397 62,717% 20,063% 524 82,780% 10,269% 589 93,049% 4,739% 619 97,788% 1,264% 627 99,052% 0,948% 633 100,000% 100,000%


Organización de datos

Numero de hogares

Frecuencia de hogares 160 140 120 100 80 60 40 20 0

gastos medios

En este grafico podemos ver que no hay un intervalo en el cual se agrupen en su mayoría los gastos de alimentación anuales. Podemos notar que se distribuyen en varios intervalos las diferentes familias, el grafico tiene la forma de una distribución normal y vemos que los gastos medios varían entre 7448,75 y 9179,55 para los hogares de estrato 2.

Numero de hogares

Poligono de frecuencias 160 140 120 100 80 60 40 20 0

Gostos medios

En el polígono de frecuencias se unen los puntos medios de los intervalos, y podemos notar, como en el grafico anterior, que esta variable tiende a distribuirse


Organización de datos

normal acumulando la mayoría de hogares entre los 3 intervalos que se encuentran entre 7665,1 y 8963,2 de gastos de alimentación anuales.

numero de hogares

Frecuencias acumuladas 700 600 500 400 300 200 100 0

Gastos medios

Con las frecuencias acumuladas y el de ojiva podemos observar que en aproximadamente el 90% de los hogares de estrato 2 gastan hasta 9179,55 en alimentación anualmente, son muy pocos los hogares de estrato 2 que gastan más de este dinero en alimentación anual.

Ojiva Numero de hogares

700 600 500 400 300 200 100 0

Gastos medios


Organización de datos

4.3. 4.4. Variables cualitativas: 4.4.1. Tiene automóvil

Tiene automóvil Número hogares % de hogares Si (1) 246 38,86% No (0) 387 61,14% Total 633 100%

Tiene automóvil 500 400 300 200 100 0 Si (1)

No (0)

En el histograma vemos que la mayoría de las familias en la muestra de estrato 2 no tienen carro.

% de hogares que tienen automóvil Si (1) 39% No (0) 61%


Organización de datos

En el grafico pastel podemos corroborar lo que nos dice el histograma de que la mayoría de las familias de estrato 2 en la muestra no tienen carro, acá además podemos ver que esa mayoría es un 61% 4.4.2. Vivienda propia

Vivienda propia Número hogares % de hogares Si (1) 404 63,82% No (0) 229 36,18% Total 633 100%

Vivienda propia 500 400 300 200 100 0 Si (1)

No (0)

La mayoría de familias en el estrato 2 de la muestra tienen vivienda propia, en el diagrama pastel podemos ver que el porcentaje de hogares en esta muestra que tienen vivienda propia es de 64%

% de hogares que tienen vivienda propia No (0) 36%

Si (1) 64%


Organización de datos

Lista de referencias

Moore, D. (2004) Estadística aplicada básica. Mozart Art, S.L.

Hopkins, K. Hopkins, B.R. Glass, G. (1997). Estadística básica para las ciencias sociales y del comportamiento. Tercera edición. Prentice Hall.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.