Estadistica descriptiva

Page 1

InformĂĄtica Aplicada a la ContadurĂ­a

Probabilistica Revista Virtual


Editorial La revista virtual Probabilística fue creada con el propósito de que las personas obtengan un mayor conocimiento sobre la estadística descriptiva; la cual tiene como finalidad es obtener información, analizarla, elaborar y simplificar lo necesario para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. Esta primera edición se encargara de mostrar los conceptos básicos mas usados en la estadística descriptiva.

Maholy Brandt Diseñador/a, Editor/a, Productor/a, Redactor/a

Índice Estadística, variables, tipos de variables

3

Individuo, población, muestra, distribución de frecuencia

4

Distribución de frecuencia agrupadas, limites de la clase, amplitud de la clase, marca de la clase, construcción de la tabla de datos agrupados

5

Medidas de posición centralizadas

6

Medidas de posición no centralizadas, medidas de dispersión

7

Medidas de forma

8y9


Conceptos Básicos Estadística descriptiva Es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables. Variables Estadísticas Es cada una de las características o cualidades que poseen los individuos de una población. Tipos de Variables Variables cualitativas o atributos

Variables cuantitativas

Se refieren a características o cualidades que no pueden ser medidas con números. (por ejemplo: nacionalidad, color de la piel, sexo).

Es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella.(edad, precio de un producto, ingresos anuales).

50 40 30 20 10 0

Futbol Baloncesto Boleibol Atletismo Mujeres Hombres

Otros

Tipos de variables cualitativas

Tipos de variables cuantitativas

Nominal Presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Ordinal Presenta modalidades no numéricas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Discreta Es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Continua Es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

3


Individuo cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. Población Conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Muestra Subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. Distribución de frecuencia O Tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Frecuencia absoluta

Frecuencia relativa

Es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por ni.

Frecuencia acumulada

Frecuencia relativa acumulada

Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi.

Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento Ni.

Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

4


Distribución de frecuencias agrupadas

O tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

27

1

1

0.032

0.032

28

2

3

0.065

0.097

29

6

9

0.194

0.290

30

7

16

0.226

0.516

31

8

24

0.258

0.774

Limites de la clase

32

3

27

0.097

0.871

33

3

30

0.097

0.968

34

1

31

0.032

1

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

31

Amplitud de la clase

1

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. Marca de la clase

Este tipo de tablas de frecuencias se utiliza con variables discretas

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Construcción de una tabla de datos agrupados 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. 2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos de queramos poner. Es conveniente que el número de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

5


ci

fi

Fi

ni

Ni

Medidas de posición centralizadas

[0, 5)

2.5

1

1

0.025

0.025

Informan sobre los valores medios de la serie de datos.

[5, 10)

7.5

1

2

0.025

0.050

Moda

[10, 15)

12.5

3

5

0.075

0.125

[15, 20)

17.5

3

8

0.075

0.200

[20, 25)

22.5

3

11

0.075

0.275

Es el valor que tiene mayor frecuencia absoluta. Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

[25, 30)

27.5

6

17

0.150

0.425

Media

[30, 35)

32.5

7

24

0.175

0.600

[35, 40)

37.5

10

34

0.250

0.850

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

[40, 45)

42.5

4

38

0.100

0.950

[45, 50)

47.5

2

40

0.050

1

40

1

6

Mediana Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se puede hallar sólo para variables cuantitativas.


Medidas de posición no centralizadas permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales Cuartiles Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Medidas de dispersión Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Varianza

Rango

Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

7

Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. Desviación típica Se calcula como raíz cuadrada de la varianza. Coeficiente de variación Se calcula como cociente entre la desviación típica y la media.


Medidas de forma (grado de concentración) Permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva. Concentración Mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra. Asimetría Mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares

8


Curtosis Mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra. Analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Tipos de curtosis

Distribución mesocúartica

Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

Distribución platicúrtica Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

9


10


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.