Distribución Chi-Cuadrado Distribución T Student ESTADISTICA
Autor: Stefania Briceño Editorial: SAIA Sede: Santiago Mariño Edición: 45
Distribución Chi-cuadrado ò Distribución de Pearson Se especifica por los grados de libertad y el parámetro de no centralidad. La distribución es positivamente asimétrica, pero la asimetría disminuye al aumentar los grados de libertad. La prueba X² de Pearson se considera una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia. La fórmula que da el estadístico es la siguiente:
Sirve para Comprobar la independencia de las variables categóricas.
Comprobar qué tan bien se ajusta una muestra a una distribución teórica.
La distribución χ² es un caso especial de la distribución gamma. De hecho
Cuando k es suficientemente grande, como consecuencia del teorema del limite central, puede aproximarse por una distribución normal:
Relación con otras distribuciones
El test de la Chi-Cuadrado se puede aplicar en situaciones donde se desea decidir si una serie de datos (observaciones) se ajusta o no a una función teórica previamente determinada (Binomial, Poisson, Normal, etc.)
Los grados de libertad de la ChiCuadrado dependen del número de parámetros que se necesitan hallar para obtener las frecuencias esperadas. En este sentido, si se requieren hallar p parámetros, los grados de libertad son (k p) si las modalidades son independientes y (k p 1) cuando las modalidades son excluyentes.
Es necesario que las frecuencias esperadas de las distintas modalidades no sea inferior a cinco. Si alguna modalidad tiene una frecuencia esperada menor que cinco se agrupan dos o más modalidades contiguas en una sola hasta conseguir que la frecuencia esperada sea mayor que cinco.
Aplicaciones
Distribución T de Student
Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeña. La distribución t de Student es la distribución de probabilidad del cociente
donde -Z es una variable aleatoria distribuida según una normal típica (de media nula y varianza 1). -V es una variable continua que sigue una distribución χ² con n grados de libertad. -Z y V son independientes
La prueba t-Student se fundamenta en dos premisas
La primera: en la distribución de normalidad,
La segunda: en que las muestras sean independientes. Permite comparar muestras, N ≤ 30 y/o establece la diferencia entre las medias de las muestras. El análisis matemático y estadístico de la prueba con frecuencia se minimiza para N > 30, utilizando pruebas no paramétricas, cuando la prueba tiene suficiente poder estadístico.
Fundamentos
Estos son los pasos a seguir cuando realizamos un ejercicio aplicando la distribución T En un universo de 44,000 niños, a los que se les registró el peso, talla e índice de masa corporal, se tomó una muestra de 56 adolescentes (21 niñas y 35 niños), del subgrupo de niñas y niños de 14 años de edad, para comparar las medias tomando exclusivamente el índice de masa corporal (IMC).
E j e m p l o
IMC en niñas y niños de 14 años de edad
Paso 1: prueba de normalidad de cada una de las muestras.
Paso 2: en este caso se hace la prueba t-test aun sabiendo que una de las muestras (los niños) no tiene normalidad. Paso 3: prueba para la homogeneidad de varianzas; se pueden considerar que son homogéneas debido a que la p = 0.570.
Paso 4: (i) diferencia de medias = 0.025, (ii) vc a las muestras.
(iii) Error estándar de las diferencias de las medias
Paso 5: el valor de la t-test será:
Paso 6: hipótesis: Ho: el IMC es igual en niños y niñas.
H1: El IMC es diferente entre los niños y las niñas. Los grados de libertad, para consultar la tabla de t-Student son 21 + 35-2 = 54, consultando el valor de p es 0.401.
Por lo tanto, no existe diferencia entre el IMC entre los niños y niñas de 14 años.