PRONÓSTICO Y PROYECCIÓN EN LOS NEGOCIOS TRABAJO FINAL Modelos de Serie de Tiempo CASO
Aguas Bonaerenses SA
Maestrandos: Ing. Lucas Sarragoicochea Ing. Pablo Marcelo Gardella
Edición 11 - 2009
CASO: Empresa Aguas Boanaerenses S.A. – Pronóstico del Consumo de Cloro en su Planta Potabilizadora Punta Lara.
INTRODUCCION Aguas Bonaerenses SA la cconcesionaria del servicio sanitario de la provincia asume la concesión en marzo de 2002 con el objetivo de garantizar la prestación de los servicios de agua potable y desagües cloacales. En la actualidad, ABSA presta servicio en 80 localidades pertenecientes a 62 partidos de la provincia de Buenos Aires, con una población servida de 3 millones de habitantes y un territorio de cobertura de 150.000 kilómetros cuadrados. ABSA posee 14 plantas potabilizadoras y 660 perforaciones. Dichas instalaciones producen mensualmente 23,5 millones de metros cúbicos de agua potable. Los 6.501 kilómetros de red de agua sumado a los 5.225 kilómetros de red de cloaca dan una extensión total de 11.726 kilómetros de redes existentes a lo largo de toda la concesión.
MARCO para el ESTUDIO Nuestro caso gira en torno al establecimiento potabilizador ubicado en la localidad de Punta Lara. Es la principal planta de tratamiento de agua superficial de la concesión. Trata diariamente unos 10.000 m3/h de agua cruda del Río de La Plata. Desde la planta se transporta el agua - mediante acueductos e impulsiones -, a las redes de abastecimiento de las ciudades de Berisso, Punta Lara, Ensenada y La Plata Para obtener el agua potable, se necesitan cumplimentar una serie de tratamientos físico químicos a través de un conjunto de instalaciones preparadas para tal fin. Para llegar a obtener el agua potable, se necesitan dos ajustes en su última etapa, que consisten en utilizar los llamados POTABILIZANTES “Lechada de Cal y Cloro “.La lechada de cal asegura cumplir con el PH que debe tener el agua de consumo para la población, -valor entre 7 y 7,4 -, mientras que el “Cloro” por su efecto bactericida permitirá contar con un agua segura para su ingesta. Planta Potabilizadora Donato Gerardi Capacidad nominal Capacidad actual Bombeo nuevo Bombeo viejo Dispersores rápidos ala Norte Dispersores rápidos ala Sur Dispersores hidráulicos (viejos) ala norte Dispersores hidráulicos (viejos) ala sur Floculadores ala norte Floculadores ala Sur Decantadores ala Norte Decantadores ala Sur Área total decantación
14000 10-11000 4*3500 3*1500 4 4 2 2 3*7 3*7 7*465 m2 7*465 m2 6510 m2
Oficina de PRODUCCION m3/hora m3/hora m3/hora (teórico) m3/hora
Bombeo viejo Bombeo viejo
Velocidad superficial a 14000 m3/hora Velocidad superficial a 11000 m3/hora Filtros rápidos (viejos) Área total filtros viejos Velocidad de filtración a 5500 m3/hora Velocidad de filtración a 7000 m3/hora Filtros rápidos (nuevos) Área total filtros nuevos Velocidad de filtración a 5500 m3/hora Velocidad de filtración a 7000 m3/hora Capacidad de planta de cloro gaseoso Máxima concentración a 14000 m3/h Máxima capacidad de neutralización de cloro Coagulante Regulación de pH
Imagen Satelital de la Planta
2,15 1,7 20*63 m2 1260 m2 4,4 5,6 14*54 m2 756 m2 7,3 9,3 200 14 1000 PAC Lechada de cal
m/h m/h
m/h m/h
m/h m/h Kg/h ppm de cloro Kg en torre de absorción
Balones de Cloro Anhidro-licuado de 1000 Kg. netos a pronosticar consumo
Sala de Cloro - Potabilizante para Desinfecci贸n del Agua
PLANTEO DEL CASO La Oficina de Producción viene llevando un registro mensual año tras año, de sus consumos de potabilizantes, Sulfato, Lechada de Cal y Cloro, que los asienta en una planilla, y los traduce en una gráfica Excel. Recientemente el Gte de Operaciones ha contratado un especialista para que le prepare un informe de pronóstico de los consumos utilizando las herramientas estadísticas. También la Gerencia General le pidió un informe al Gte Operaciones donde presente un detalle de los Modelos que se ajustan al seguimiento de sus consumos de potabilizantes, más allá de los gráficos de representación de consumos mensuales.
El gerente general necesita contar con un Modelo que le permita saber el comportamiento del consumo de potabilizantes, detectar outlayers de consumos, etc. También quiere tener tipificada las variables que le servirán a la empresa para extrapolarlas a las instalaciones de su nueva planta de tratamiento a ejecutarse a unos pocos kilómetros distante de la misma, y cuya fuente también será el Río de la Plata. Por último quiere formar su opinión respecto de las partidas presupuestarias anuales y establecer con mayor certeza todo tipo de desviaciones en las partidas sabiendo de las bondades de ajuste del modelo y sus desviaciones. Nota: Cada balón de cloro anhidro-licuado contiene un neto de 1000kg.Mediante tubos se extrae el cloro en su fase líquida pasando luego por un sistema de última generación que lo transforma en cloro gaseoso para finalmente incorporarlo al proceso – al agua que se distribuirá a la población.
Datos aportados por la Oficina de Producción del Establecimiento El técnico de la oficina de producción aportó la serie de tiempos donde constan los consumos de kilos de cloros mensuales año tras año. Le confió al consultor que los consumos año tras año son similares variando de acuerdo a las condiciones del agua del río. Un dato importante es que cuando se aproxima el invierno, se producen brechas de amoníaco en el agua que demandan el uso de grandes cantidades de cloro, y en el verano disminuye el consumo, porque la planta hoy en día está continuamente trabajando a su máxima capacidad instalada. También le informo que el consumo de agua por los pobladores -del cual depende el consumo de cloro -, merma por las noches, pero igualmente la planta sigue produciendo a buen ritmo durante la noche para recuperar en tanque cisterna el aumento de demanda sufrido durante el día.
INFORME A LA GERENCIA MODELOS ESTIMADOS PARA CONSUMO DE CLORO Y PRONÓSTICOS EFECTUADOS ANÁLISIS DE SERIES DE TIEMPO Los datos están expresados a través de una serie de tiempo mensual. Ello implica que es posible estudiar Tendencia (T), estacionalidad (S), ciclicidad (C), y la componente aleatoria (R), de la serie de tiempo, siempre que exista relación entre los valores temporales. Su período es 12 porque son 12meses en el año, valor del intervalo que se utilizará para suavizar la serie y eliminar la estacionalidad. PASO 1. Grafico la Serie y hago la observación visual Gráfica de series de tiempo de Consumo de Cloro
Gráfica de series de tiempo de Consumo de Cloro 90000
Consumo de Cloro
80000 70000 60000 50000 40000 30000 20000 10000 0 ene-03 jul-03
feb-04
sep-04
abr-05
nov-05
Fecha
jun-06
ene-07 ago-07 mar-08
oct-08
Observamos que la gráfica tiene una representación de comportamiento cuasi estacionaria en el tiempo y también se aprecia una estacionalidad. Como nos comentó el técnico de la oficina de producción, los picos de mayores consumos impactan en los meses más fríos debido a las brechas de amoniaco,- nótese julio y agosto. Existe un segundo pico de menor tamaño durante los meses de verano producido por el aumento de consumo de agua de la población Para poder aplicar algún método de pronóstico primero debo averiguar si la serie de tiempo bajo estudio es o no aleatoria. Para ello a través del Minitab obtengo la Tabla de los coeficientes de autocorrelación Los coeficientes de autocorrelación estarán distribuidos alrededor de cero, entre 1 y -1 – intervalo del coeficiente de correlación-. Sucede que no puedo afirmar nada sobre su proximidad, es decir si son significativamente distintos de cero o no, por lo que necesito estimar con determinado nivel de confianza el intervalo. El correlograma me permite apreciar sólo cuán próximo están los coeficientes a cero. luego necesito el intervalo para realmente discernir si estoy en presencia de una serie aleatoria o de
una serie que tiene determinado patrón en el tiempo que me permita pronosticar por el método que mejor se ajuste. Para ello me fijo mi error - 5% en nuestro caso -, y armo el intervalo de confianza - banda -, que serán los límites de los rk para considerar la serie aleatoria. Si todos los rk caen dentro de la BANDA la serie será aleatoria, es decir no hay relación entre los distintos valores de la serie desplazada en el tiempo, sino que se dan al azar. Estadística > Serie de Tiempo > Autocorrelación. Función de autocorrelación: Consumo de Cloro Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ACF 0,537274 0,231133 -0,113865 -0,258142 -0,388200 -0,453974 -0,436270 -0,265141 -0,002702 0,272744 0,429299 0,454713 0,383852 0,133964 -0,111768 -0,232912 -0,233920 -0,284340 -0,247817 -0,153451
T 4,50 1,54 -0,73 -1,65 -2,39 -2,59 -2,28 -1,29 -0,01 1,30 2,00 2,01 1,60 0,54 -0,45 -0,93 -0,93 -1,11 -0,95 -0,58
LBQ 21,08 25,04 26,02 31,11 42,79 59,02 74,25 79,96 79,97 86,21 101,96 119,92 132,95 134,57 135,71 140,78 145,98 153,82 159,88 162,26
Autocorrelación para Consumo de Cloro
Función de autocorrelación para Consumo de Cloro (con límites de significancia de 5% para las autocorrelaciones)
1,0 0,8
Autocorrelación
0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
20
Vemos que al menos 4 coeficientes son significativamente distintos de cero. Por lo tanto la serie no es aleatoria y existe alguna correlación entre los valores temporales
Una autocorrelación parcial nos permitirá saber si es posible ajustar un modelo ARIMA. Función de autocorrelación parcial: Consumo de Cloro Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
PACF 0,537274 -0,080876 -0,289575 -0,091560 -0,211842 -0,260561 -0,207988 -0,078127 0,028087 0,116228 0,101877 0,084064 0,105407 -0,117767 -0,105364 0,096361 0,165578 -0,043696 0,014900 0,018226
T 4,50 -0,68 -2,42 -0,77 -1,77 -2,18 -1,74 -0,65 0,23 0,97 0,85 0,70 0,88 -0,99 -0,88 0,81 1,39 -0,37 0,12 0,15
Autocorrelación parcial para Consumo de Cloro
Función de autocorrelación parcial de Consumo de Cloro (con límites de significación de 5% para las autocorrelaciones parciales)
1,0
Autocorrelación parcial
0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
20
Existen al menos 2 coeficientes significativamente distintos de cero
Para poder estudiar mejor la serie y poder generar pronósticos, plantearemos distintos modelos y seleccionaremos el que más se ajusta.
MODELO DE MEDIA MOVIL Aquí en vez de trabajar con “n” elementos de la serie, trabajo con un valor menor que me lo fijo, puesto que las última observaciones son mejores que las primeras. Suavizo la serie eliminando los picos de estacionalidad. Tomo 12 periodos que corresponden a los 12 meses de cada año. Me sirve para obtener mi serie suavizada. En el primer año calculo la media de los 12meses dividiendo la suma de ingresos de los 12 meses por n=12 y se lo adjudico al ultimo mes en la serie ajustada. Queda evidenciado que éste método es bueno en series estacionarias para eliminar la estacionalidad pero cuando no es estacionaria, sólo suaviza la serie. Por otra parte pesa a todos los ingresos con la misma importancia y se olvida de los primeros valores. No tiene memoria ni pesa adecuadamente. En el Minitab: Estadística > Serie de Tiempo > Promedio Mobil. Promedio móvil de Consumo de Cloro Datos Longitud NMissing
Consumo de Cloro 70 0
Promedio móvil Longitud
12
Bondad del Ajuste Medidas de exactitud MAPE MAD MSD
34 11809 233222941
Intervalo de Pronóstico del Consumo en kilos de Cloro Anhidro licuado Pronósticos Período 71 72 73 74 75 76 77 78 79 80 81 82
Pronóstico 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6 38726,6
Inferior 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72 8794,72
Superior 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4 68658,4
Indicadores de Pronostico Hasta aquí: Media Móvil MAPE MAD MSD
34 11809 233222941
El valor de MAD representa el desvío absoluto medio, es decir que en promedio el modelo tiene una diferencia respecto al valor real de 11809 Kg de Cloro por mes.
Intervalo de Pronóstico El programa me da el valor de pronóstico para el año siguiente. Este tipo de modelo elimina la estacionalidad. Los valores de pronóstico para los periodos siguientes son iguales. Veamos la línea de ajuste, pronósticos y grafico de errores Gráfica de promedio móvil de Consumo de Cloro
Gráfica de promedio móvil de Consumo de Cloro 100000
Variable Actual Ajustes Pronósticos 95,0% PI
Consumo de Cloro
80000
Promedio móv il Longitud 12
60000
Medidas de exactitud MAPE 34 MAD 11809 MSD 233222941
40000
20000
0
3 3 4 4 5 6 6 7 8 - 0 o- 0 -0 - 0 o-0 - 0 c- 0 o-0 -0 r r r e c i i b b b d d a a a en ag ag ag Fecha
Queda evidenciado en la gráfica que el promedio móvil no evidencia ser un buen modelo de pronóstico. Si bien suaviza la serie en los valores promedio, no contempla la estacionalidad Gráfica normal de residuos para Consumo de Cloro
Gráfica de probabilidad normal (la respuesta es Consumo de Cloro)
99
95 90
Porcentaje
80 70 60 50 40 30 20 10 5
1
-40000 -30000 -20000 -10000
0
10000 Residuo
20000
30000
40000
50000
Observamos que no es un buen ajuste. Sólo suavizó la serie. Además no contempló los primeros valores. Presenta un defasaje en elevación donde debería ser un descenso en abril de del 2008. No es un buen pronóstico. Para comprobar si los residuos se encuentran distribuidos aleatoriamente realizamos una autocorrelación entre estos Función de autocorrelación: RESID1 Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ACF 0,564374 0,232494 -0,099999 -0,226523 -0,424314 -0,479620 -0,484883 -0,298133 -0,015820 0,183311 0,326815 0,353215 0,358827 0,175494 -0,077814 -0,182564 -0,191159 -0,247699 -0,256275 -0,160822
T 4,30 1,38 -0,58 -1,30 -2,36 -2,45 -2,25 -1,28 -0,07 0,76 1,35 1,41 1,39 0,66 -0,29 -0,68 -0,70 -0,91 -0,92 -0,57
LBQ 19,45 22,81 23,44 26,74 38,57 53,96 70,00 76,19 76,21 78,64 86,55 95,99 105,95 108,38 108,87 111,64 114,74 120,08 125,94 128,30
Autocorrelación para RESID1
Función de autocorrelación para RESID1
(con límites de significancia de 5% para las autocorrelaciones) 1,0 0,8
Autocorrelación
0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
20
Se puede observar que existe más de un valor por fuera del intervalo de aceptación de la hipótesis nula. Entonces podemos concluir que los errores están correlacionados. Queda parte de la serie que el modelo de promedio móvil no explica
MODELO DE ATENUACIÓN EXPONENCIAL SIMPLE Nuevo Pronóstico = α x (nueva observación) + (1 - α) x (pronóstico anterior) Ŷt+1 = α Yt + (1 - α ) Ŷt Es decir, es el pronóstico anterior más α veces el error en el pronóstico anterior. Se busca el valor de α, de tal manera de obtener el mínimo valor de los indicadores de pronostico (MAD, MAPE, MSD) En el Minitab: Estadística > Serie de Tiempo > Suavización Exponencial Simple. Suavización exponencial simple para Consumo de Cloro Datos Longitud
Consumo de Cloro 70
Constante de suavización Alfa
0,812598
Medidas de exactitud MAPE MAD MSD
28 10293 205353182
Pronósticos Período 71 72 73 74 75 76 77 78 79 80 81 82
Pronóstico 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4 44173,4
Inferior 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9 18955,9
Superior 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8 69390,8
La constante de atenuación (α) varia entre 0 y 1. Si quiero hacer pesar los valores finales de la serie, ingreso al MINITAB un valor grande de α (cercano a uno). Si por el contrario pongo un valor bajo de α, estoy haciendo pesar mas en el nuevo pronostico, el pronostico anterior. El programa tiene la opción de buscar el α que minimiza los errores (itera). El mejor alfa (obtenido con el Minitab) es α = 0,812598 lo que significa que pesa mas en el modelo la ultima observación. Indicadores de Pronostico Hasta aquí: Media Móvil S. Exp. Simple MAPE MAD MSD
34 11809 233222941
MAPE MAD MSD
28 10293 205353182
Con este método los indicadores de pronóstico son más pequeños y por lo tanto mejores Pero veamos que se puede apreciar en el grafico siguiente.
Gráfica de suavización exponencial simple de Consumo de Cloro
Gráfica de suavización para Consumo de Cloro Método exponencial simple
Variable Actual Ajustes Pronósticos 95,0% PI
90000
Consumo de Cloro
80000 70000
Constante de suav ización Alfa 0,812598
60000 50000
Medidas de exactitud MAPE 28 MAD 10293 MSD 205353182
40000 30000 20000 10000 0
3 3 4 4 5 6 6 7 8 - 0 o-0 r -0 c-0 o- 0 r- 0 c- 0 o- 0 r -0 e i i b b b d d a a a en ag ag ag Fecha
Observamos que la gráfica ajusta bastante bien pero con desfasaje relativo. Se observa en la gráfica que la curva de ajuste (pronostico) parece encontrarse desfasada en el tiempo, dando valores sobreestimados y subestimados según cambia la curva real Gráfica normal de residuos para Consumo de Cloro
Gráfica de probabilidad normal (la respuesta es Consumo de Cloro)
99,9 99
Porcentaje
95 90 80 70 60 50 40 30 20 10 5 1 0,1
-50000
-25000
0 Residuo
25000
50000
Observamos que no es un buen ajuste. Sólo suavizó la serie. Para comprobar si los residuos se encuentran distribuidos aleatoriamente realizamos una autocorrelación entre estos
Función de autocorrelación: RESID2 Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ACF 0,007664 0,004513 -0,233350 -0,075393 -0,097118 -0,143329 -0,200049 -0,157735 -0,014697 0,154697 0,206425 0,179199 0,223924 -0,008280 -0,167073 -0,145530 0,025302 -0,103419 -0,098974 -0,095576
T 0,06 0,04 -1,95 -0,60 -0,77 -1,12 -1,54 -1,18 -0,11 1,13 1,48 1,25 1,53 -0,05 -1,10 -0,94 0,16 -0,66 -0,63 -0,60
LBQ 0,00 0,01 4,10 4,54 5,27 6,89 10,09 12,11 12,13 14,14 17,78 20,57 25,00 25,01 27,57 29,54 29,60 30,64 31,61 32,53
Autocorrelación para RESID2
Función de autocorrelación para RESID2
(con límites de significancia de 5% para las autocorrelaciones) 1,0 0,8
Autocorrelación
0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
20
Destacamos importante que los residuos caen todos dentro de la zona de banda del intervalo de confianza que significa son independientes entre sí. Aunque si bien no hay coeficientes significativamente distintos de cero, no significa que el modelo tenga un buen ajuste
MODELO DE ATENUACIÓN EXPONENCIAL DOBLE Este modelo utiliza el valor atenuado exponencialmente y el valor doblemente atenuado de la serie para obtener el pronóstico de los periodos futuros. Con el Minitab:
Estadística > Serie de Tiempo > Suavización Exponencial Doble. Suavización exponencial doble para Consumo de Cloro
Datos Longitud
Consumo de Cloro 70
Constantes de suavización Alfa (nivel) Gamma (tendencia)
0,995117 0,018602
Medidas de exactitud MAPE MAD MSD
29 10553 216500569
Pronósticos Período 71 72 73 74 75 76 77 78 79 80 81 82
Pronóstico 42730,3 42452,1 42173,9 41895,7 41617,5 41339,4 41061,2 40783,0 40504,8 40226,6 39948,5 39670,3
Inferior 16875 3086 -11392 -26130 -40990 -55918 -70887 -85883 -100898 -115926 -130963 -146008
Superior 68585 81818 95740 109921 124225 138597 153010 167449 181907 196379 210860 225349
Indicadores de Pronostico Hasta aquí: Media Móvil S. Exp. Simple
S. Exp. Doble
MAPE MAD MSD
MAPE MAD MSD
34 11809 233222941
MAPE MAD MSD
28 10293 205353182
29 10553 216500569
Con este modelo los indicadores de pronóstico son un poco mayores a los del modelo de atenuación exponencial simple. Teniendo en cuenta que el modelo es simple es mejor y más simple que el doble, hasta aquí el modelo que mejor se ajusta es el modelo de atenuación exponencial simple. Intervalo de Pronóstico El programa me da la recta de pronóstico y los valores del año 2009 con su correspondiente intervalo para un nivel de confianza del 95%. Veamos de todas maneras que se puede apreciar en el grafico del modelo de atenuación exponencial doble
Gráfica de suavización exponencial doble de Consumo de Cloro
Gráfica de suavización para Consumo de Cloro Método exponencial doble
Variable Actual Ajustes Pronósticos 95,0% PI
Consumo de Cloro
200000
100000
Constantes de suav ización Alfa (niv el) 0,995117 Gamma (tendencia) 0,018602
0
Medidas de exactitud MAPE 29 MAD 10553 MSD 216500569
-100000
-200000
03 03 04 04 05 06 06 07 08 e- go- br- ic- go- br - ic- go- br n d a d a a a a e a Fecha
Observamos que la gráfica ajusta bastante bien pero con un desfasaje relativo al igual que para el modelo de atenuación exponencial simple La gráfica que la curva de ajuste (pronostico) parece encontrarse desfasada en el tiempo, dando valores sobreestimados y subestimados según cambia la curva real
Gráfica normal de residuos para Consumo de Cloro
Gráfica de probabilidad normal (la respuesta es Consumo de Cloro)
99,9 99
Porcentaje
95 90 80 70 60 50 40 30 20 10 5 1 0,1
-50000
-25000
0 Residuo
25000
50000
La grafica normal de residuos también es muy parecida a la del modelo de atenuación exponencial simple No hay un buen ajuste a la diagonal.
Veamos que dicen los coeficientes de autocorrelación de los residuos Función de autocorrelación: RESID3 Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ACF -0,169240 0,044077 -0,219905 -0,011833 -0,057518 -0,087253 -0,144384 -0,131339 -0,015076 0,121831 0,149106 0,104810 0,192544 -0,014334 -0,139257 -0,119263 0,073544 -0,092348 -0,066419 -0,086352
T -1,42 0,36 -1,79 -0,09 -0,45 -0,68 -1,11 -0,99 -0,11 0,91 1,10 0,76 1,39 -0,10 -0,98 -0,82 0,50 -0,63 -0,45 -0,58
LBQ 2,09 2,24 5,87 5,88 6,14 6,74 8,41 9,81 9,83 11,08 12,98 13,93 17,21 17,23 19,00 20,33 20,85 21,67 22,11 22,86
Autocorrelación para RESID3
Función de autocorrelación para RESID3
(con límites de significancia de 5% para las autocorrelaciones) 1,0 0,8
Autocorrelación
0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
20
Como era de esperarse al igual que en el modelo de atenuación exponencial simple los errores parecen aleatorios según su función de autocorrelación
MODELO DE WINTERS El modelo de Winter es un modelo de atenuación exponencial ajustada a la tendencia y a la variación estacional. Por lo que este método se debería ajustar mejor a la serie de tiempo que estamos estudiando ya que parece tener variaciones estacionales. Es, como los demás métodos de suavizamiento, un método iterativo en el que a partir de un dato inicial hay que ir buscando la curva que mejor se ajusta a los datos reales.
En el Minitab: Estadística > Serie de Tiempo > método de Winters Adoptamos el método multiplicativo, producto de (T S C R), pero también podría probarse los resultados con el aditivo suma de (T S C R).El multiplicativo se adapta mejor a series económicas. A continuación se muestra los indicadores de pronóstico, y los pronósticos para los valores de los coeficientes del modelo de Winters que minimizan los errores. Método de Winters para Consumo de Cloro Método multiplicativo Datos Longitud
Consumo de Cloro 70
Constantes de suavización Alfa (nivel) Gamma (tendencia) Delta (estacional)
0,3 0,0 0,0
Medidas de exactitud MAPE MAD MSD
20 6863 96600974
Pronósticos Período 71 72 73 74 75 76 77 78 79 80 81 82
Pronóstico 32535,5 28835,1 36613,7 30479,3 34269,8 36103,7 47068,3 66847,7 70300,0 73360,2 56765,6 47108,7
Inferior 15721,2 11418,2 18500,0 11585,2 14521,4 15436,5 25425,9 44180,9 46566,1 48522,0 30790,6 19968,4
Superior 49349,7 46252,0 54727,4 49373,5 54018,2 56770,9 68710,8 89514,5 94033,9 98198,4 82740,7 74249,0
Indicadores de Pronostico Hasta aquí: Media Móvil S. Exp. Simple
S. Exp. Doble
Winters
MAPE MAD MSD
MAPE MAD MSD
MAPE MAD MSD
34 11809 233222941
MAPE MAD MSD
28 10293 205353182
29 10553 216500569
20 6863 96600974
Los valores de los indicadores de pronóstico son los mejores obtenidos hasta el momento. En el grafico de más adelante, ya se puede ver como el modelo se ajusta más convenientemente a la serie original. Intervalo de Pronóstico El programa me da los valores del pronóstico de todo el año 2009 con su correspondiente intervalo para un nivel de confianza del 95%. Como se puede observar en el grafico siguiente, estos valores no son constantes (suavización exponencial simple) ni pertenecen a una misma
recta (suavización exponencial doble) sino que están afectados por la estacionalidad y son diferentes para los distintos meses del año. Gráfica de método Winters de Consumo de Cloro
Gráfica de método Winters de Consumo de Cloro Método multiplicativo
100000
Variable Actual Ajustes Pronósticos 95,0% PI
Consumo de Cloro
80000
Constantes de suav ización Alfa (niv el) 0,3 Gamma (tendencia) 0,0 Delta (estacional) 0,0
60000 40000
Medidas de exactitud MAPE 20 MAD 6863 MSD 96600974
20000 0
03 03 04 -04 -05 -06 -06 -07 - 08 r r e- go- br c o c o n di di a ab ab e a ag ag Fecha
Observamos que el ajuste a la curva actual y su pronóstico son aceptables. El valor de diciembre de 2006 parece ser un outlayer, ya que la experiencia indica que su valor de lectura real debería haber sido similar al resto. El valor de agosto 03 y 07 son lecturas confiables por lo que se deduce que existe una componente aleatoria que provoca esas desviaciones respecto del ajuste. Gráfica normal de Residuos para Consumo de Cloro
Gráfica de probabilidad normal (la respuesta es Consumo de Cloro)
99,9 99
Porcentaje
95 90 80 70 60 50 40 30 20 10 5 1 0,1
-40000
-30000
-20000
-10000 0 Residuo
10000
20000
30000
Pese a que la curva de pronostico se ajusta mucho mejor a los datos reales, la curva normal de residuos no se ajusta bien a la diagonal. Veamos que nos dicen los coeficientes de autocorrelación de los residuos Función de autocorrelación: RESID4 Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ACF -0,051332 -0,164102 -0,214660 0,141959 -0,011289 -0,027871 -0,154282 -0,051082 0,157476 0,144705 0,013586 -0,217660 0,014573 -0,024571 -0,094055 -0,016412 0,139586 0,050270 -0,029917 0,004192
T -0,43 -1,37 -1,75 1,11 -0,09 -0,21 -1,18 -0,38 1,18 1,06 0,10 -1,57 0,10 -0,17 -0,66 -0,11 0,97 0,34 -0,20 0,03
LBQ 0,19 2,19 5,65 7,19 7,20 7,26 9,17 9,38 11,43 13,19 13,20 17,32 17,34 17,39 18,21 18,23 20,08 20,33 20,42 20,42
Autocorrelación para RESID4
Función de autocorrelación para RESID4
(con límites de significancia de 5% para las autocorrelaciones) 1,0 0,8
Autocorrelación
0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
Los residuos parecen ser aleatorios METODO DE DESCOMPOSICIÓN El método de descomposición separa la serie de tiempo en sus componentes: Estacionalidad (S) Tendencia (T) Ciclicidad (C) Aleatoriedad (R)
20
Existen dos tipos de enfoque: el aditivo y el multiplicativo. Utilizamos el multiplicativo porque se adapta mejor a series económicas. La descomposición se puede efectuar por pasos manualmente, o si la tendencia es lineal, el Minitab descompone la serie según tendencia y estacionalidad, y proporciona así la recta de tendencia y los coeficientes estacionales para cada mes Estadística > Serie de Tiempo > Descomposición Descomposición de series de tiempo para Consumo de Cloro Modelo multiplicativo Datos Longitud NMissing
Consumo de Cloro 70 0
Ecuación de tendencia ajustada Yt = 38119 + 48,4*t Índices estacionales Período 1 2 3 4 5 6 7 8 9 10 11 12
Índice 0,84550 0,64604 0,72906 0,80013 0,97830 1,45715 1,55022 1,48312 1,20339 0,89963 0,70592 0,70154
Medidas de exactitud MAPE MAD MSD
17 6283 89452905
Pronósticos Período 71 72 73 74 75 76 77 78 79 80 81 82
Pronóstico 29333,7 29185,5 35215,4 26939,1 30436,2 33441,7 40936,1 61043,3 65017,1 62274,8 50587,5 37861,5
Indicadores de Pronostico Hasta aquí: Media Móvil S. Exp. Simple
S. Exp. Doble
Winters
Descomposición
MAPE MAD MSD
MAPE MAD MSD
MAPE MAD MSD
MAPE MAD MSD
34 11809 233222941
MAPE MAD MSD
28 10293 205353182
29 10553 216500569
20 6863 96600974
17 6283 89452905
Los valores de los indicadores de pronóstico son los mejores obtenidos. En el grafico de más adelante, ya se puede ver como el modelo se ajusta convenientemente a la serie original. Intervalo de Pronóstico El programa me da los valores del pronóstico de todo el año 2009 Como se puede observar en el grafico siguiente, estos valores no son constantes (suavización exponencial simple) ni pertenecen a una misma recta (suavización exponencial doble) sino que son diferentes para los distintos meses del año. En este caso corresponden a la multiplicación de la recta de tendencia por el índice estacional correspondiente al periodo. Gráfica de descomposición de series de tiempo de Consumo de Cloro
Gráfica de descomposición de series de tiempo de Consumo de Cloro Modelo multiplicativo
Variable Actual Ajustes Tendencia Pronósticos
90000
Consumo de Cloro
80000 70000 60000 50000
Medidas de exactitud MAPE 17 MAD 6283 MSD 89452905
40000 30000 20000 10000 0
4 5 03 03 04 06 - 06 - 07 - 08 - 0 o- 0 rrr e- goc o ic b b n g d di a a ab e a a ag Fecha
Vemos una leve tendencia en el consumo de cloro que puede ser motivo de un aumento de la producción o de pequeños cambios en las condiciones del agua del río o bien una combinación de ambas. Sin embargo la tendencia debería mantenerse tal cual expresa el modelo, porque el promedio de producción anual se mantiene aproximadamente constante en los años, y las condiciones del río también, aunque influidas por el régimen de mareas y cambios climáticos - meses de frío y/o calidos desplazados y/o postergados o acortados.Descomposición - Análisis de componente para Consumo de Cloro Observamos en el grafico siguiente que al ser la tendencia casi cero, el gráfico de la izquierda prácticamente concuerda con el de tendencia invertida - es decir sin tendencia -.Pero podemos ver como actúan los índices estacionales en las curvas inferiores, ya que los datos ajustados estacionalmente presentan una recta bastante bien alisada si se comparan con los datos originales
Análisis de componente para Consumo de Cloro Modelo multiplicativo
Datos originales
Datos con tendencia invertida
90000
2,0 1,5
60000
1,0
30000
0,5 ene-03
feb-04
abr-05 jun-06 Fecha
ago-07
oct-08
ene-03
Datos ajustados estacionalmente
feb-04
abr-05 jun-06 Fecha
ago-07
oct-08
Datos con elim. de tend. y ajuste estac. 40000
90000
20000
60000
0 30000 -20000 ene-03
feb-04
abr-05 jun-06 Fecha
ago-07
oct-08
ene-03
feb-04
abr-05 jun-06 Fecha
ago-07
oct-08
Descomposición - Análisis estacional para Consumo de Cloro
Análisis estacional para Consumo de Cloro Modelo multiplicativo
Índices estacionales
Datos con tendencia invertida por estación
1,5
2,0
1,2
1,5 1,0
0,9
0,5 0,6 1
2
3
4
5
6
7
8
9
10 11 12
1
2
3
Variación porcentual por estación 20
4
5
6
7
8
9
10 11 12
Residuos por estación 40000 20000
10
0 -20000
0
1
2
3
4
5
6
7
8
9
10
11 12
1
2
3
4
5
6
7
8
9
10 11 12
Nos resta observar los gráficos de residuos y su correspondiente autocorrelación
Gr谩fica normal de residuos para Consumo de Cloro
Gr谩fica de probabilidad normal (la respuesta es Consumo de Cloro)
99,9 99
Porcentaje
95 90 80 70 60 50 40 30 20 10 5 1 0,1
-30000
-20000
-10000
Funci贸n de autocorrelaci贸n: RESID5 Desfase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ACF 0,124699 -0,031179 -0,098042 0,122559 -0,010668 -0,023624 -0,145147 -0,037919 0,120722 0,092116 -0,043310 -0,198604 -0,040235 -0,063770 -0,104170 -0,043750 0,100695 0,058893 -0,008239 -0,010434
T 1,04 -0,26 -0,81 1,00 -0,09 -0,19 -1,17 -0,30 0,95 0,72 -0,33 -1,53 -0,30 -0,48 -0,77 -0,32 0,74 0,43 -0,06 -0,08
LBQ 1,14 1,21 1,93 3,08 3,09 3,13 4,82 4,93 6,14 6,85 7,01 10,44 10,58 10,95 11,94 12,12 13,08 13,42 13,43 13,44
0 10000 Residuo
20000
30000
40000
Autocorrelación para RESID5
Función de autocorrelación para RESID5
(con límites de significancia de 5% para las autocorrelaciones) 1,0 0,8
Autocorrelación
0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0 2
4
6
8
10 12 Desfase
14
16
18
20
CONCLUSION De todos los modelos estudiados el modelo que mejor se ajusta al consumo de cloro a través del tiempo es el Método de descomposición. La serie de tiempo responde a la siguiente recta de tendencia Ecuación de tendencia ajustada Yt = 38119 + 48,4*t
Y los índices estacionales sobre los cuales se calcula la variación estacional para cada mes son: Índices estacionales Período 1 2 3 4 5 6 7 8 9 10 11 12
Índice 0,84550 0,64604 0,72906 0,80013 0,97830 1,45715 1,55022 1,48312 1,20339 0,89963 0,70592 0,70154
Los indicadores para evaluar el ajuste obtenido con estos parámetros son: Medidas de exactitud MAPE MAD MSD
17 6283 89452905
Recordemos que cuanto mas bajos estos indicadores, menor es el error cometido, tomando como error la diferencia entre el valor real y el pronosticado. Tomando el valor de MAD podemos decir que aproximadamente el desvío estándar del consumo se encuentra en los 6283 Kg. De cloro por mes Utilizando este modelo con los parámetros descriptos, el pronostico extendido para los 12 siguientes periodos (año 2009se muestran a continuación: Pronósticos Período 71 72 73 74 75 76 77 78 79 80 81 82
Pronóstico 29333,7 29185,5 35215,4 26939,1 30436,2 33441,7 40936,1 61043,3 65017,1 62274,8 50587,5 37861,5
Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009
------------------------------------------------------------------------------