El análisis de informaciòn

Page 1

UNIVERSIDAD RICARDO PALMA Escuela de Post Grado Maestría en Docencia Superior

ANÁLISIS DESCRIPTIVO DE DATOS PRESENTACIÓN EN CUADROS Y GRÁFICOS

SILVANA CÁRDENAS QUINTANA

Octubre, 2009


EL ANALISIS DE LA INFORMACIÓN Dominar conceptos básicos para el análisis estadístico Cuando se tiene bastante claridad acerca del problema que se va a investigar y cuando ya se ha definido el conjunto de conceptos o hipótesis que guiarán el trabajo de investigación, es necesario considerar la forma como se harán y cómo se analizarán las observaciones que servirán para concluir acerca de la verdad o falsedad de las hipótesis planteadas. En conclusión, la información por sí sola no soluciona los problemas a los que nos enfrentamos. Es necesario tener un buen entendimiento del problema a investigar, para identificar qué y cuánta información se necesita. ANALISIS ESTADÍSTICO Una de las etapas importantes en el proceso de investigación se relaciona con la sistematización y análisis de la información. Esta etapa que se conoce como la de Análisis Estadístico de la Información, es una disciplina que se define como la ciencia de la recolección, análisis, interpretación y presentación de información que puede expresarse en forma numérica. Por tanto, la Estadística tiene una gran importancia en la tarea de generar conocimiento acerca de las características de una estructura, o de un proceso dado, y en general en la solución de los problemas de investigación. La estadística se basa en la existencia de las técnicas que conforman un cuerpo completo de métodos para clasificar, describir e inferir algo a partir de información numérica. ESTADISTICA DESCRIPTIVA Cuando el investigador ha recolectado la información que necesita para su investigación, procede al análisis descriptivo de las variables bajo estudio, es decir describe lo que ha encontrado en su investigación, sin la capacidad de poder inferir conclusiones.


ANÁLISIS DESCRIPTIVO 1. PRESENTACIÓN DE LA INFORMACIÓN MEDIANTE CUADROS O TABLAS 1.1 Tabla o cuadro estadístico: Es un conjunto de filas y columnas. Estructura de una tabla: 1. Número ( cuando hay varias tablas) 2. Título (¿Qué?, ¿Cuándo?, ¿Dónde?) 3. Encabezamiento (referente a la primera fila) es donde se indica la naturaleza (las categorías de la variable) del contenido de cada columna. 4. Columna matriz. Aquí es designada la naturaleza (las modalidades de la variable) del contenido de cada fila, 5. Cuerpo. Donde se consignan los datos. 6. Pie (fuente de aclaraciones necesarias: Fuente, notas, comentarios). Ejemplo:

Tabla N º 1

1 2

ALUMNOS DE LA URP CLASIFICADOS SEGÚN FACULTAD Y SEXO SEGÚN MATRICULA 2008 (*) 3 FACULTAD

4

TOTAL

SEXO Masculino Femenino

TOTAL Ciencias Contables Derecho Ingeniería Psicología

6

Fuente: Oficina de Matrícula. (*) Los datos se refieren al semestre 2008-1

5


1.2 Tabulación de datos Tabulación.- Es ordenar la información en una tabla y contar. Conceptos Sea X una característica de la población en estudio que toma diferentes valores xi, i= 1,……, k Frecuencia absoluta de un dato (fi ) Llamaremos frecuencia absoluta de un valor x de la variable estadística X, al número de veces que aparece repetido dicho valor en el conjunto de observaciones. Frecuencia relativa de un dato (hi ) Frecuencia relativa de un valor observado x i de la variable X , al cociente entre su frecuencia absoluta (f ) y el número de observaciones realizadas (n) y se denota por hi = fi / n, i=1,…K Se expresa en términos de porcentajes. Frecuencia absoluta acumulada (Fi ) La frecuencia absoluta acumulada de un valor x de la variable X es igual a la suma de los valores inferiores o iguales a dicho valor. Frecuencia relativa acumulada (Hi ) Se llama frecuencia relativa acumulada de un valor x de una variable X, al cociente entre su frecuencia absoluta acumulada y el número de observaciones realizadas (n). Se denote por Hi = Fi /n

Propiedades de las frecuencias Sea n el número total de observaciones realizadas de la variable X que toma valores xi 1. ∑fi = n 2. ∑hi = 1 ó 100% 3.Fk = n 4.Hk = 1 5. 0 ≤ fi ≤ n i=1, …., 6. 0 ≤ hi ≤ 1 i=1, …..

k k


1.3 Tabulación de datos de una variable cualitativa Se hace una lista de las posibles categorías de la variable y se ve cuantas veces se repite cada una. Ejemplo: NUMERO DE HOGARES DE LIMA METROPOLITANA SEGÚN EL TIPO DE VIVIENDA QUE OCUPAN. 2007 (*) Tipo de vivienda Total Casa independiente Dpto. en edificio Vivienda en quinta Vivienda en vecindad Otro

fi 80 5

hi 1.00 0.06

25 20 20

0.31 0.25 0.25

10

0.13

Fuente: INEI. Encuesta de Hogares (ENAHO). Interpretación: f1: 5 hogares ocupan casas independientes. h1: El 6% de los hogares ocupan casas independientes.

1.4 Tabulación de datos de una variable discreta ( de recorrido corto) Sea una variable discreta X cuyos valores observados son x 1 , x2 ……xk Se hace una lista de los diferentes valores que toma la variable, se ordena en forma ascendente y se ve cuantas veces se repite cada valor. Valores de X Total x1 x2 . xK

fi

hi

Fi

Hi

n f1 f2 . fK

1 H1 H2 . hK

F F . FK = n

H1 H2 . HK = 1


Ejemplo: Sean 12 alumnos clasificados según el número de cursos aprobados en el último semestre: 3, 2, 2, 3, 3, 3, 7, 6, 5, 1, 4, 4 Sea X: Número de cursos aprobados X Total 1 2 3 4 5 6 7

fi 12 1 2 4 2 1 1 1

hi 1.00 0.08 0.17 0.33 0.17 0.08 0.08 0.08

Fi

Hi

1 3 7 9 10 11 12

0.08 0.25 0.58 0.75 0.83 0.92 1.00

Interpretación: f3 = 4, hay 4 alumnos que han aprobado 3 cursos. h6 = 0.08, el 8% de los alumnos han aprobado 5 cursos. F4 = 9, existen 9 alumnos que han aprobado a lo más 4 cursos. H5 = 0.83, el 83 % de los alumnos han aprobado a lo más 5 cursos. 1.5 Tabulación de datos cuantitativos de variable continua y de variable discreta ( de recorrido amplio) Cuando se trata de datos de una característica cuantitativa de variable continua se tienen que formar intervalos sucesivos que abarquen todo el recorrido. Igualmente si tenemos una característica cuantitativa de variable discreta de recorrido amplio no conviene enumerar uno a uno los valores que toma sino conviene formar intervalos. Reglas para la construcción de una tabla (distribución de frecuencias) 1. Determinación del recorrido o rango de los datos (R) Rango = Valor máximo - valor mínimo 2. Determinación del número de intervalos ( I ) a) Se calcula de forma tentativa y aproximada. b) Existen fórmulas para su cálculo: • I = 5, sí n = 5 I = n , sí n>25 • Fórmula de Sturges: I = 1+ 3.22 log(n)


3. Determinación de la amplitud del intervalo ( A ) A=R/I 4. Determinación de los límites del intervalo. Se debe tomar el resultado numérico más bajo como el límite inferior del primer intervalo. Luego agregar A para obtener el límite superior y así sucesivamente. Ejemplo: En una oficina de prensa, el tiempo requerido para armar la totalidad de la página editorial fue registrada durante 50 años. Los datos aproximados a la décima de minuto más cercana, se dan enseguida: 20.8 25.3 23.7 21.3 19.7

22.8 20.7 20.3 21.5 24.2

21.9 22.5 23.5 23.1 23.8

22.0 21.2 19.0 19.9 20.7

20.7 23.8 25.1 24.2 23.8

20.9 23.3 25.0 24.1 24.3

25.0 20.9 19.5 19.8 21.1

22.2 22.9 24.1 23.9 20.9

22.8 23.5 24.2 22.8 21.6

20.1 19.5 21.8 23.9 22.7

Construya la distribución de frecuencias para el tiempo. Solución: Rango = 25.3 - 19.0 = 6.3 I = n = 50 = 7.07, aprox. 7 intervalos A = R / I = 6.3 / 7 = 0.9 Tiempo para armar la totalidad de la página editorial Tiempo Total [ 19.0 - 19.9 ) [ 19.9- 20.8 ) [ 20.8 - 21.7 ) [ 21.7 - 22.6 ) [ 22.6 - 23.5 ) [ 23.5 - 24.4 ) [ 24.4 - 25.3 )

fi 50 5 6 9 5 7 14 4

hi 1.00 0.10 0.12 0.18 0.10 0.14 0.28 0.08

Fi

Hi

5 11 20 25 32 46 50

0.10 0.22 0.40 0.50 0.64 0.92 1.00

Interpretación: f 3 : Durante 9 años el tiempo requerido fue entre 20.8 y 21.6 minutos. h3 : En el 18% de los años se tomó entre 20.8 y 21.6 minutos. F3 : En 20 años el tiempo requerido fue entre 19.0 y 21.6 minutos. H3: en el 40% de los años se requirió entre 19.0 y 21.6 minutos. 2. PRESENTACION GRAFICA DE VARIABLES


2.1 Presentaci贸n grafica de variables cualitativas Barras.- Se usan cuando la variable tiene muchas categor铆as. a) Simples

Numero de Hogares segun el Tipo de vivienda que ocupan

Tipo

Otros

10

Vivien. en Vecindad

20

Vivienda en quinta

20

25

Dpto. en edificio

5

Casa Indepen. 0

5

10

15 Nro. Hogares

b)Componentes

20

25

30


NĂşmero de Hogares segun tipo de vivienda que ocupan 100%

80%

20

20

70% Nro. Hogares

5

10

90%

60% 50%

20 20

40%

Otros Vivien. en Vecindad

30%

Vivienda en quinta

5

25

20%

Dpto. en edificio

10%

10

5

Casa Indepen.

0% Lima

Rimac Distrito

Circulares.- Cuando la variable tiene pocas categorĂ­as.

Numero de Hogares segun Tipo de vivienda que ocupan

Otros

Casa Indepen. Dpto. en Edificio

Vivien. en Vecindad Vivienda en Quinta


2.2 Presentación grafica de variables discretas (de recorrido corto) Gráfica de las frecuencias absolutas Varas o bastones de anchura igual a cero.

fi

1

2

3

4

5

6

7

xi

2.3 Presentación grafica de variables continuas o discretas (de recorrido amplio) Gráfica de las frecuencias absolutas Histograma.- Es una figura compuesta por una serie de rectángulos contiguos en que cada uno debe tener un área proporcional a la frecuencia del intervalo respectivo. Polígono.- Se construye uniendo los puntos medios de la parte superior de cada rectángulo del histograma.


Histograma de la variable tiempo para armar la totalidad de una pĂĄgina editorial durante 50 aĂąos 12 10

8 6 4 Std. Dev = 1.74

2

Mean = 22.33 N = 50.00

0 19.00

20.00 19.50

Tiempo

20.50

21.00

22.00

21.50

23.00 22.50

24.00 23.50

25.00

24.50

25.50


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.