Unidad 2 Fundamentos matemĂĄticos y estadĂsticos
Contenido 2.1 Generación de números aleatorios y de distribuciones de probabilidad. 2.2 Método de Monte Carlo. 2.3 Pruebas de ajuste de curvas. 2.4 Uso del Software para ajuste de curvas.
Un elemento importante en la simulación es la obtención de valores aleatorios con distribuciones específicas: uniforme, normal, triangular, etc.
La mayoría de los métodos de generación de números aleatorios comienzan con un número inicial llamado valor semilla, a este número se le aplica un determinado procedimiento para obtener un nuevo valor. Usando este número como entrada, el procedimiento es repetido para lograr un próximo número aleatorio. Software a usar XLStat
2.1 GeneraciĂłn de nĂşmeros aleatorios y de distribuciones de probabilidad
Generación de números aleatorios Un número aleatorio es un número que se elige al azar entre un universo de posibilidades de tamaño previamente definido; para el caso de la simulación se requiere de grandes cantidades de valores aleatorios. Existen diferentes formas de obtener números aleatorios: • Métodos Manuales: lanzamientos de monedas, dados, cartas y ruletas, son los métodos más simples pero también son lentos. • Métodos matemáticos: —Cuadrados Medios —Congruencial multiplicativo —Congruencial mixto
Método Congruencial Este método fue ideado por D.H. Lehmer en 1949. La secuencia de números aleatorios se obtiene aplicando la siguiente relación de recurrencias: Xn+1= (aXn + c ) mod M n>0 Donde: • M magnitud del modulo M>0 • a constante multiplicativa 0 ≤ a <M • c constante aditiva 0≤c<M • X0 valor semilla 0 ≤ X0 < M De acuerdo al valor de c, este método se clasifica en : • 1. Congruencial mixto si c>0 • 2. Congruencial multiplicativo si c=0
Método Congruencial • Mod representa el residuo entero entre la división de dos números, por ejemplo 16 mod 3 es igual a 1, ya que:
1 residuo entero de la división
Método Congruencial multiplicativo El método multiplicativo el general próximo número pseudoaleatorio a partir del último número generado, de acuerdo a la siguiente ecuación de recurrencia: Xn+1= (aXn ) mod M n>0 Donde: a= es la constante multiplicativa. m= es la magnitud del módulo. X0 = es el valor semilla.
Método Congruencial mixto Genera una secuencia de números aleatorios en la cual el próximo número es determinado a partir del último número generado. El método mixto tiene la siguiente ecuación de recurrencia: Xn+1= (aXn + c ) mod M Donde: a= es la constante multiplicativa. c= es la constante aditiva. m= es la magnitud del módulo. X0 = es el valor semilla.
n>0
Ejemplo Tomamos X0=9, a=8, c=3 y M=10. Entonces la relaciĂłn congruencial es:
Nota: Si se quiere obtener nĂşmeros Uniformes (0,1) , se normaliza el resultado: Un=Xn/m
Distribuciรณn de probabilidad Una distribuciรณn de probabilidad describe el rango de valores que puede tomar una variable aleatoria y la probabilidad asignada a cada valor o rango de valores.
DistribuciĂłn de probabilidad Poisson Discretas
Binomial
Bernoulli GeomĂŠtrica Uniforme
Distribuciones
Exponencial
Normal Continuas
Gamma Beta Weibull
Distribución de probabilidad Discretas • Las distribuciones discretas son aquellas en las que la variable puede tomar un número determinado de valores, por ejemplo, si se tira un dado puede salir un número de 1 a 6. • Cada valor de entre un conjunto de valores, tiene asignada una determinada probabilidad de ocurrencia. • Distribuciones de probabilidad discreta: Discreta, Binomial, Poisson, Bernoulli, Geométrica.
Distribución de probabilidad Continuas •
Una variable aleatoria representada mediante una distribución continua de probabilidad puede tomar cualquier valor dentro de un rango determinado, por ejemplo el peso de un grupo de personas (60.1kg, 55.8kg, 82.6kg, 76.4 kg, etc.)
•
Distribuciones continuas: Normal, Lognormal, Uniforme, Triangular
Distribuciones comunes • Poisson – Su modelo considera el número de sucesos independientes que se producen en una cantidad de tiempo o espacio; por ejemplo, el número de clientes que llagan a una tienda durante 1 hora, o el número de defectos encontrados en 30 metros cuadrados de una hoja de metal. • Binomial –Modela el numero de éxitos en n pruebas, cuando las pruebas son independientes con una probabilidad de éxito común, p ; por ejemplo; el numero de chips defectuosos de computadora encontrados en una gran cantidad de n chips. • Binomial Negativa – El modelo consiste en el numero de ensayos necesarios para lograr k éxitos; por ejemplo, el número de chip de computadora que tenemos que inspeccionar para encontrar 4 chips defectuosos. Banks et al., pp. 314-316
Distribuciones comunes • Uniforme continua- Modelos de complete incertidumbre. Todos los resultados son igualmente probable. Esta distribución se utiliza a menudo cuando no hay datos. • Normal – Esta distribución puede ser pensada como la suma del numero de los componentes del proceso; por ejemplo, el tiempo de montaje de un producto es la suma de todos los tiempos necesarios para cada operación de montaje. • Lognormal – Modelo de la distribución de un proceso que puede ser considerado como el producto de una series de tareas que lo componente; por ejemplo, la tasa de inversión, cuando se agrava el interés, es el producto de los rendimientos de varios periodos. Banks et al., pp. 314-316
Distribuciones comunes • Exponencial – Modelo del tiempo entre eventos independientes, o un tiempo de proceso sin memoria; por ejemplo, los tiempos entre las llegadas de una gran población de clientes potenciales que actúan de forma independiente el uno del otro. La distribución exponencial es muy variable, a menudo es usada en exceso, ya que hace a los modelos matemáticos manejables. Recordemos que si el tiempo entre eventos se distribuye exponencialmente, entonces el número de eventos en un periodo fijo de tiempo es una distribución de Poisson.
Banks et al., pp. 314-316
Distribuciones comunes • Gamma – Una distribución muy flexible que se usa para modelar variables aleatorias no negativas (se puede mover de 0 añadiendo una constante) . • Beta – Una distribución muy flexible que se usa para modelar variables aleatorias acotadas . La distribución beta puede moverse lejos de 0 mediante la adición de una constante y se puede dar un rango más grande de [ 0 , 1 ] mediante la multiplicación por una constante . • Weibull – Modela el tiempo hasta la falla de los componentes; por ejemplo, el tiempo hasta la falla de una unidad de disco duro. La distribución exponencial es un caso especial de la Weibull. Banks et al., pp. 314-316
Otras distribuciones • Triangular – Modela un proceso para el que solo se conocen el mínimo, la moda, y el máximo; por ejemplo, el mínimo, la moda y el máximo requerido para probar un producto. Este modelo es mucho mejor que la distribución uniforme [en muchos casos]. • Pert – Es un caso especial de la distribución Beta con un mínimo, moda y máximo. La distribución Pert ofrece la alternativa “suavización” en la ausencia de datos. • Empírica – Muestra la distribución de los datos reales recolectados; de uso frecuente cuando no hay una distribución teórica apropiada. Banks et al., pp. 314-316
Variables Aleatorias Discretas
Trejo,O. (20/06/2012). Distribuciones Discretas y Continuas. Recuperado de https://otrenav.wordpress.com/category/probabilidad/
Variables Aleatorias Continuas
Trejo,O. (20/06/2012). Distribuciones Discretas y Continuas. Recuperado de https://otrenav.wordpress.com/category/probabilidad/
2.2MĂŠtodo de Monte Carlo
Método de Monte Carlo • El
nombre y el desarrollo sistemático de los métodos de Monte Carlo data aproximadamente de 1944 con el desarrollo de la computadora.
• La aplicación del los métodos de Monte Carlo como una herramienta viene del
trabajo de la bomba atómica durante la Segunda Guerra Mundial al involucrar la simulación directa de problemas probabilísticos de hidrodinámica concernientes a la difusión de neutrones aleatorios en material de fusión.
• Metodología aleatorias.
para realizar simulaciones basada en muestras
Método de Monte Carlo • El método hace uso de la estadística y las computadoras para imitar mediante modelos matemáticos, el comportamiento aleatorio de sistemas, al obtener valores aleatorios que se ajusten a una distribución de probabilidad.
• Matemáticamente el cálculo Monte Carlo es una integración de los valores aleatorios generados y la función de la densidad de la probabilidad.
Método de Monte Carlo 1.
Comprender el problema
2. Determinar variables aleatorias para “la incertidumbre” del problema. 3. Iterar tantas veces como muestras necesitemos. 4. Determinar las distribuciones del conjunto de números aleatorios.
5. Calcular los estadísticos (media, desviación estándar, error) y realizar el histograma. 6. Analizar los resultados
Excel como herramienta de apoyo Para la generación de variables aleatorios y su relación con la distribución de la probabilidad se hace uso de software, por ejemplo Excel. Si se desea generar números aleatorios en Excel se pueden usar las funciones:
Función Descripción ALEATORIO () Números aleatorios uniformes (0,1) ALEATORIO.ENTRE(a,b) Números aleatorios entre a y b
Nota: Para consultar todas las distribuciones disponibles en Excel consultar el apartado de funciones estadísticas
Excel como herramienta de apoyo Para obtener el valor aleatorio ajustado a una distribución de probabilidad, se debe generar una formula que permita la generación aleatoria de número así como la obtención de los valores ajustados a un distribución: Distribución
Parámetro
Fórmula
Exponencial
Lambda
=-LN(1-ALEATORIO())*Lambda
Normal
Media µ, Desviación σ
=DISTR.NORM.INV(ALEATORIO(), µ, σ)
Lognormal
Media de Ln µ, Desviación de Ln σ
=DISTR.LOG.INV(ALEATORIO(), µ, σ)
Uniforme
Extremo inferior a Extremo superior b
=A+(b-a)*ALEATORIO()
Nota: Para consultar todas las distribuciones disponibles en Excel consultar el apartado de funciones estadísticas
Método de Monte Carlo "Una empresa manufacturera utiliza en un proceso un par de cortadoras y quiere determinar qué cortadora es la más rápida después de realizar 100 cortes en cada una. Se sabe que la Cortadora 1 en promedio se tarda 20 minutos para realizar el corte, mientras la cortadora2 tarda en promedio 21 minutos. Los tiempos históricos observados en cada cortadora se comportan de acuerdo a una distribución normal, con desviación estándar de 3.4 minutos para la cortadora1 y de 2.6 minutos para la cortadora 2.” a) Simulador los tiempos para los 100 cortes de cada maquina b) Determinar cúal cortadora es la más rápida, concluir objetivamente"
2.3 Pruebas de ajuste de curvas
2.3 Pruebas de ajuste de curvas • En muchas ocasiones cuando se está simulando un sistema, tanto las variables de entrada como las de salida tienen un comportamiento aleatorio por lo que se requiere encontrar el modelo de distribución de probabilidad que pueda representar las serie de datos. Ho: X sigue cierta distribución H1: X no sigue cierta distribución • Este ajuste de los datos a un modelo de distribución de probabilidad se puede realizar por medio de las pruebas estadísticas mas conocidas como pruebas de bondad de ajuste
Indicadores de Bondad de Ajuste Los indicadores estadísticos de Bondad de Ajuste más usados son : 1.
Para distribuciones discretas y continuas: Chi cuadrado X2.
2. Para distribuciones continuas: Kolmogorov-Smirnov (K-S). No es muy
sensible para detectar discrepancias en las colas de la distribución.
Indicadores de Bondad de Ajuste •
Hay muchas distribuciones que tienen formas similares y que pueden ser capaces de generar los datos observados.
•
Cuanto menor sea el valor de cada indicador, mayor será el ajuste aparente entre la distribución teórica y los datos observados.
•
Los valores standard de K-S esta limitado para comparar valores críticos cuando hay menos de 50 observaciones.
Prueba de Chi cuadrado
2 X
• Sea
una muestra aleatoria de tamaño n tomada de una población con una distribución especificada f0(x) que es de interés verificar.
• Suponer que las observaciones de la muestra están agrupadas en k clases, siendo Oi la cantidad de observaciones en cada clase i = 1, 2, ..., k
• Con el modelo especificado f (x) se puede calcular la probabilidad pi que un dato 0
cualquiera pertenezca a una clase i.
Nota: En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias observadas “o”(las que se observa directamente) y frecuencias esperadas o teóricas “e” (las que se calculan de acuerdo a las leyes de probabilidad).
Prueba de Chi cuadrado
2 X
• La prueba de Chi Cuadrado compara X2 de la prueba con el valor de X2 de tablas (valor esperado).
• Si el valor estadístico de la prueba es menor al valor esperado (tabla) entonces la hipótesis nula es aceptada, de lo contrario se rechaza.
Nota: Para consultar el valor en tabla de Chi consultar http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf
Prueba de Kolmogororov-Smirnov (KS) • Compara los valores de las funciones de distribución de la muestra y de la población que se ha postulado en la hipótesis nula. • El estadístico de prueba z se calcula en función de la máxima diferencia entre ambas funciones:
Donde Fn(x) = la función de distribución observada Fo(x)= la función teórica correspondiente a la distribución esperada
Prueba de Kolmogororov-Smirnov (KS) • Si los valores observados Fn(X) son similares a los esperados F0 (x) el valor de D será pequeño. • Cuanto mayor sea la diferencia entre la distribución propuesta y la distribución esperada (teórica) , mayor será el valor de D. • Dicho estadístico D se comparará con el correspondiente de la tabla del tests de K-S. Si el valor de D es menor al valor de D Tabla entonces la hipótesis nula es aceptada, de lo contrario se rechaza.
Nota: Para consultar el valor en tabla de D consultar : http://www4.ujaen.es/~mpfrias/TablasInferencia.pdf
Recomendaciones y Bibliografía • Para conocer más sobre las distribuciones se pude consultar los capítulos 3 y 4 del libro Probabilidad y estadística para Ingeniería y ciencias de Jay L. Devore • SIMIO cuenta con el libro “Refence Guide” en el apartado Support, el cual contiene una breve reseña de las distribuciones y sus parámetros. • Si se requiere profundizar en la terminología de estadística, consultar: http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib090 0/Libro.pdf
2.4 Uso del Software para ajuste de curvas
2.4 Uso del Software para ajuste de curvas. • •
XLStat Pro es un complemento para excel. Se puede descargar la versión de prueba con duración de 30 días en: • http://www.xlstat.com/es/descargar.html
•
Se usará el modulo de modelización, apartado Ajuste de una distribución, están disponibles las distribuciones : Beta, Binomial, Binomial negativa, Chi-cuadrado, Exponencial, Fisher, Fisher-Tippett, Gamma, GEV, Gumbel, Lognormal, Normal, Pareto, Poisson, Student, Uniforme, Weibull.
•
Este modulo permite efectuar las pruebas de bondad de ajuste Chi-cuadrado y Kolmogorov-Smirnov.
Ajuste de una distribución con XLSTAT PRO 1. Los datos en Excel deben estar ordenados en una solo columna. 2. Seleccionar en la barra de menú, la pestaña COMPLEMENTOS, clic en el Icono Cargar XLSTAT
Botón para cargar XLSTAT, dar clic
Pestaña complementos, dar clic
Ajuste de una distribución con XLSTAT PRO 3. Se cargara el complemento XLSTAT en una nueva pestaña. Seleccionar el icono Modelización de datos (Modeling Data si se instalo en ingles). Dar Clic
4. Al seleccionar el icono Modelización de datos se desplegara una serie de opciones, seleccionar Ajuste de una ley de probabilidad.
Dar clic
Ajuste de una distribuciรณn con XLSTAT PRO 5. Se desplegara un cuadro de dialogo, en donde se debe indicar: โ ข Las celdas donde se encuentran los datos. Dar clic
Se abrirรก una ventana para seleccionar los datos
Dar Clic y seleccionar los datos
Una vez seleccionados los datos, se regresa al cuadro de dialogo dando enter.
Ajuste de una distribuciรณn con XLSTAT PRO 6. Seleccionar la distribuciรณn a la cual se quieren ajustar los datos.
Dar clic
Ajuste de una distribuciรณn con XLSTAT PRO 7. Para saber si la distribuciรณn a la cual se esta ajustando es la adecuado, seleccionar la prueba de Chi Cuadrado. Si se cuenta con menos de 40 observaciones se puede seleccionar la prueba K-S.
Seleccionar
Ajuste de una distribuciรณn con XLSTAT PRO 8. Para finalizar el ajuste se da clic en OK.
Clic
Ajuste de una distribución con XLSTAT PRO • XLSTAT habrá generado en una nueva hoja el ajuste a la distribución seleccionada y nos postrará sus parámetros. • Al realizar el test de Chi-Cuadrado, nos mostrará una tabla con el valor observado, el valor critico, el valor de p y el valor de alpha, con el fin de aceptar o rechazar el ajuste a la distribución seleccionada. • También se genera una tabla de frecuencia y su histograma.