TEMA 2: PARÁMETROS ESTADÍSTICOS. 1. Parámetros estadísticos. Tipos: 1.1. Medidas de centralización.
MEDIA: -Media aritmética: La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por
y se calcula mediante la expresión:
xi representa el valor de la variable o en su caso la marca de clase.
Propiedades: 1. Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho numero. 2. Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha cantidad. 3. Además de la media aritmética existen otros conceptos de media, como son la media geométrica y la media armónica.
-Media geométrica: La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G.
Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.
-Media armónica: La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H
Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente.
MODA: La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por lo tanto el cálculo de la moda en distribuciones discretas o cualitativas no precisa de una explicación mayor; sin embargo, debemos detenernos un poco en el cálculo de la moda para distribuciones cuantitativas continuas.
Apoyándonos en el gráfico podemos llegar a la determinación de la expresión para la Moda que es:
Otros autores dan una expresión aproximada para la moda que viene dada por la siguiente expresión:
1.2. Medidas de posición.
MEDIANA: La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua. Cálculo de la mediana en el caso discreto: Tendremos en cuenta el tamaño de la muestra. Si N es Impar, hay un término central, el término
que será el valor de la mediana.
Si N es Par, hay dos términos centrales,
la mediana será la media de esos dos valores
Cálculo de la mediana en el caso continuo: Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de la siguiente forma: Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas. De donde la mediana vale:
donde ai es la amplitud del intervalo
CUARTILES: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles: - El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos - El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos - El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos
PERCENTILES: Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%.
1.3. Medidas de dispersión.
RANGO: Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax – xmin
RANGO INTERCUARTÍLICO: En estadística descriptiva, se denomina rango intercuartílico o rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribución. Es una medida de la dispersión estadística. A diferencia del rango, se trata de un estadístico
robusto.
RQ = Q3 - Q1
VARIANZA: Es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.
Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza:
Si los datos están agrupados utilizamos las marcas de clase en lugar de X i.
DESVIACIÓN MEDIA: La desviación media es la media de las diferencias en valor
absoluto de los valores a la media.
DESVIACIÓN TÍPICA: La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza
Para estimar la desviación típica de una población a partir de los datos de una muestra se utiliza la fórmula (cuasi desviación típica):
1.4. Medidas de forma.
COEFICIENTE DE ASIMETRÍA: Se define el coeficiente de asimetría como:
Como
puede ser positivo o negativo, este coeficiente puede serlo también; de manera que atendiendo al signo, en una distribución unimodal pueden presentarse los siguientes casos: - Sesgada a la izquierda si - Simétrica si
.
.
- Sesgada a la derecha si
.
Propiedades: - Esta medida no depende de las unidades de las variables.
- Es invariante por cambio de escala.
COEFICIENTE DE APUNTAMIENTO: Se define el coeficiente de apuntamiento como:
Dependiendo del resultado pueden presentarse los siguientes casos: - La distribución se considera aplastada si - Se considera normal si - Se considera apuntada si
.
. .
2. Interpretación de la medida y desviación típica. 2.1. Desigualdad de TCHEBYCHEFF. Las conclusiones que se pueden obtener sobre la distribución son muy importantes si se utilizan conjuntamente la media y la desviación típica. Tchebycheff demostró que bajo condiciones generales en el intervalo
se encuentra al menos el 75% de la población y en el intervalo
se encuentra al menos el 89% de la población.
2.2. Coeficiente de variación. Para evitar el problema que plantean tanto la varianza como la desviación típica, a efecto de comparaciones entre distribuciones, ya que son dependientes de las unidades de las variables, se define el coeficiente de variación de Pearson, que es independiente de las unidades de medida. Y se define como:
Si el denominador es muy próximo a cero, no debe usarse, ya que puede dar un grado erróneo de dispersión, dependiendo del valor del numerador. Cuanto menor es el coeficiente de variación, menos dispersión tiene la distribución, y por tanto la media es más representativa.
3. Transformaciones ( Suma y producto) en un conjunto de datos estadísticos. Suma: Si se suma un valor constante, es la media de la anterior distribución mas dicha constante.
Multiplicación: Si se multiplica, la media queda multiplicada.