2.3 Pruebas de ajuste de curvas • En muchas ocasiones cuando se está simulando un sistema, tanto las variables de entrada como las de salida tienen un comportamiento aleatorio por lo que se requiere encontrar el modelo de distribución de probabilidad que pueda representar las serie de datos. Ho: X sigue cierta distribución H1: X no sigue cierta distribución • Este ajuste de los datos a un modelo de distribución de probabilidad se puede realizar por medio de las pruebas estadísticas mas conocidas como pruebas de bondad de ajuste
Indicadores de Bondad de Ajuste Los indicadores estadísticos de Bondad de Ajuste más usados son : 1.
Para distribuciones discretas y continuas: Chi cuadrado X2.
2. Para distribuciones continuas: Kolmogorov-Smirnov (K-S). No es muy
sensible para detectar discrepancias en las colas de la distribución.
Indicadores de Bondad de Ajuste •
Hay muchas distribuciones que tienen formas similares y que pueden ser capaces de generar los datos observados.
•
Cuanto menor sea el valor de cada indicador, mayor será el ajuste aparente entre la distribución teórica y los datos observados.
•
Los valores standard de K-S esta limitado para comparar valores críticos cuando hay menos de 50 observaciones.
Prueba de Chi cuadrado
2 X
• Sea
una muestra aleatoria de tamaño n tomada de una población con una distribución especificada f0(x) que es de interés verificar.
• Suponer que las observaciones de la muestra están agrupadas en k clases, siendo Oi la cantidad de observaciones en cada clase i = 1, 2, ..., k
• Con el modelo especificado f (x) se puede calcular la probabilidad pi que un dato 0
cualquiera pertenezca a una clase i.
Nota: En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias observadas “o”(las que se observa directamente) y frecuencias esperadas o teóricas “e” (las que se calculan de acuerdo a las leyes de probabilidad).
Prueba de Chi cuadrado
2 X
• La prueba de Chi Cuadrado compara X2 de la prueba con el valor de X2 de tablas (valor esperado).
• Si el valor estadístico de la prueba es menor al valor esperado (tabla) entonces la hipótesis nula es aceptada, de lo contrario se rechaza.
Nota: Para consultar el valor en tabla de Chi consultar http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf
Prueba de Kolmogororov-Smirnov (KS) • Compara los valores de las funciones de distribución de la muestra y de la población que se ha postulado en la hipótesis nula. • El estadístico de prueba z se calcula en función de la máxima diferencia entre ambas funciones:
Donde Fn(x) = la función de distribución observada Fo(x)= la función teórica correspondiente a la distribución esperada
Prueba de Kolmogororov-Smirnov (KS) • Si los valores observados Fn(X) son similares a los esperados F0 (x) el valor de D será pequeño. • Cuanto mayor sea la diferencia entre la distribución propuesta y la distribución esperada (teórica) , mayor será el valor de D. • Dicho estadístico D se comparará con el correspondiente de la tabla del tests de K-S. Si el valor de D es menor al valor de D Tabla entonces la hipótesis nula es aceptada, de lo contrario se rechaza.
Nota: Para consultar el valor en tabla de D consultar : http://www4.ujaen.es/~mpfrias/TablasInferencia.pdf
Recomendaciones y Bibliografía • Para conocer más sobre las distribuciones se pude consultar los capítulos 3 y 4 del libro Probabilidad y estadística para Ingeniería y ciencias de Jay L. Devore • SIMIO cuenta con el libro “Refence Guide” en el apartado Support, el cual contiene una breve reseña de las distribuciones y sus parámetros. • Si se requiere profundizar en la terminología de estadística, consultar: http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib090 0/Libro.pdf
2.4 Uso del Software para ajuste de curvas
2.4 Uso del Software para ajuste de curvas. • •
XLStat Pro es un complemento para excel. Se puede descargar la versión de prueba con duración de 30 días en: • http://www.xlstat.com/es/descargar.html
•
Se usará el modulo de modelización, apartado Ajuste de una distribución, están disponibles las distribuciones : Beta, Binomial, Binomial negativa, Chi-cuadrado, Exponencial, Fisher, Fisher-Tippett, Gamma, GEV, Gumbel, Lognormal, Normal, Pareto, Poisson, Student, Uniforme, Weibull.
•
Este modulo permite efectuar las pruebas de bondad de ajuste Chi-cuadrado y Kolmogorov-Smirnov.
Ajuste de una distribución con XLSTAT PRO 1. Los datos en Excel deben estar ordenados en una solo columna. 2. Seleccionar en la barra de menú, la pestaña COMPLEMENTOS, clic en el Icono Cargar XLSTAT
Botón para cargar XLSTAT, dar clic
Pestaña complementos, dar clic
Ajuste de una distribución con XLSTAT PRO 3. Se cargara el complemento XLSTAT en una nueva pestaña. Seleccionar el icono Modelización de datos (Modeling Data si se instalo en ingles). Dar Clic
4. Al seleccionar el icono Modelización de datos se desplegara una serie de opciones, seleccionar Ajuste de una ley de probabilidad.
Dar clic
Ajuste de una distribuciรณn con XLSTAT PRO 5. Se desplegara un cuadro de dialogo, en donde se debe indicar: โ ข Las celdas donde se encuentran los datos. Dar clic
Se abrirรก una ventana para seleccionar los datos
Dar Clic y seleccionar los datos
Una vez seleccionados los datos, se regresa al cuadro de dialogo dando enter.
Ajuste de una distribuciรณn con XLSTAT PRO 6. Seleccionar la distribuciรณn a la cual se quieren ajustar los datos.
Dar clic
Ajuste de una distribuciรณn con XLSTAT PRO 7. Para saber si la distribuciรณn a la cual se esta ajustando es la adecuado, seleccionar la prueba de Chi Cuadrado. Si se cuenta con menos de 40 observaciones se puede seleccionar la prueba K-S.
Seleccionar
Ajuste de una distribuciรณn con XLSTAT PRO 8. Para finalizar el ajuste se da clic en OK.
Clic
Ajuste de una distribución con XLSTAT PRO • XLSTAT habrá generado en una nueva hoja el ajuste a la distribución seleccionada y nos postrará sus parámetros. • Al realizar el test de Chi-Cuadrado, nos mostrará una tabla con el valor observado, el valor critico, el valor de p y el valor de alpha, con el fin de aceptar o rechazar el ajuste a la distribución seleccionada. • También se genera una tabla de frecuencia y su histograma.