Seleting Genetics advisers - Breedmarket

Page 1

Red Neuronal Artificial para previsión de cotizaciones y tendencias en los Mercados Financieros

Germán Jerez Muñoz Pablo Cortés Achedad Departamento de Organización Industrial y Gestión de Empresas II

Escuela Técnica Superior de Ingeniería Universidad de Sevilla Sevilla, 2017



i


Red Neuronal Artificial para previsión de cotizaciones y tendencias en los Mercados Financieros

Germán Jerez Muñoz Pablo Fabio Cortés Achedad

ii


© 2017 Germán Jerez Muñoz, Pablo Cortés Achedad. Todos los derechos reservados

iii


Escuela Técnica Superior de Ingeniería Universidad de Sevilla Departamento de Organización Industrial y Gestión de Empresas II Camino de los descubrimientos s/n 41092 Sevilla España

Impreso en Sevilla, el XXVII de VI de 2017

No está permitida la distribución de este texto, a terceras personas, por cualquier medio. El uso de este texto y formato, en fichero electrónico, está restringido al personal y alumnado de la Escuela Técnica Superior de Ingeniería.

iv


A nuestras familias A nuestros maestros

v


vi


Agradecimientos

A mi familia, en especial a mis padres (Germán y Cari) y hermanos (Ale, Elena y Maribel) por su incansable apoyo, sin vosotros nada sería posible. A mis abuelos, por enseñarme tanto. A mis amigos, a todos y cada uno de ellos. En especial a mis compañeros de piso durante los años de universidad, Adrián y Rubén. Y un especial agradecimiento a todas y cada una de las personas que han formado parte de mi vida.

Germán Jerez Muñoz Sevilla, 2017

vii



ix


Resumen

En el presente documento se muestra el resultado del proyecto de investigación realizado como Trabajo Fin de Master Universitario en Ingeniería Industrial. Se diseña, desarrolla y testea un algoritmo basado en Redes Neuronales tipo NARX, para la previsión de tendencias en las cotizaciones de los Mercados Financieros con un timeframe semanal. El desarrollo del algoritmo se realiza mediante el software informático MATLAB®, y se testea sobre los siguientes Índices mundiales: S&P 500, DAX 30, DJIA 30, IBEX 35, NASDAQ y NIKKEI 225.

x


xi


Abstract

The present document shows the result of the research project carried out as Master Thesis Project in Industrial Engineering. An algorithm based on Neural Networks (NARX) is designed, developed and tested for forecasting trends in financial market quotes with a weekly timeframe. The algorithm is developed using MATLAB® software and tested on the following world indices: S&P 500, DAX 30, DJIA 30, IBEX 35, NASDAQ and NIKKEI 225.

xii


xiii


Índice

Agradecimientos

vii

Resumen

x

Abstract

xii

Índice

xiv

Índice de Figuras

xvii

Notación

xxii

1.

Objeto del Proyecto

25

2.

Introducción

27

3.

Contexto de los Mercados Financieros 3.1. La Bolsa de Valores 3.1.1. Conceptos básicos de bolsa y los mercados de valores 3.1.2. Las Bolsas Españolas 3.1.3. Funciones de la Bolsa dentro del sistema financiero 3.1.4. Coste de las operaciones en bolsa 3.1.5. Derivados 3.1.6. CFDs 3.2. Eficiencia de los mercados 3.2.1. La hipótesis débil del mercado eficiente 3.2.2. La hipótesis intermedia del mercado eficiente 3.2.3. La hipótesis fuerte del mercado eficiente 3.2.4. Información influyente en los mercados financieros 3.3. Principales Índices mundiales 3.3.1. Historia 3.3.2. Índices bursátiles en el mundo xiv

29 29 30 31 35 36 37 39 40 42 42 43 43 46 47 47


3.4. FOREX

49

4.

Conceptos básicos de los Mercados Financieros 4.1. Análisis Técnico 4.1.1. Teoría de Dow 4.1.2. Tipos de gráficos empleados 4.1.3. Herramientas de análisis gráfico 4.1.4. Ramas de estudio del análisis técnico 4.2. Principales indicadores en el análisis técnico cuantitativo 4.2.1. Indicadores de volatilidad 4.2.2. Indicadores de tendencia 4.2.3. Osciladores 4.2.4. Indicadores William 4.2.5. Indicadores de volumen

51 51 53 55 59 62 63 64 66 69 72 74

5.

Redes Neuronales 5.1. Conceptos básicos 5.2. Perceptrón multicapa 5.2.1. Arquitectura 5.2.2. Propagación de los patrones de entrada 5.2.3. Consideraciones de diseño 5.2.4. Algoritmo de Retropropagación 5.2.5. Algoritmos de entrenamiento avanzados

77 77 79 80 81 84 86 95

6.

Redes Neuronales en MATLAB® 6.1. Arquitectura de las Redes Neuronales en MATLAB® 6.2. Neural Network Toolbox Product Description 6.3. Uso de Neural Network Times SeriesTool

100 100 107 108

7.

Previsión de valores de índices en entorno MATLAB® 7.1. Algoritmo utilizado 7.1.1. Teoría de los Grandes Números 7.1.2. Plantillas Excel 7.1.3. Código MATLAB

120 120 122 123 127

8.

Análisis y resultados 8.1. Análisis de Índices 8.1.1. DAX 30 8.1.2. DOW JONES

131 131 131 136 xv


8.1.3. IBEX 35 8.1.4. NASDAQ 8.1.5. NIKKEI 225 8.1.6. S&P 500 8.2. Análisis Global 9.

141 146 151 156 161

Conclusiones

164

Referencias

166

xvi


ÍNDICE DE FIGURAS Figura 3-1-comparación_derivados .................................................................................... 38 Figura 4-1-Gráfico lineal. Fuente: Prorealtime .................................................................. 56 Figura 4-2-Punto y figura. Fuente: Prorealtime ................................................................ 57 Figura 4-3-Barras. Fuente: Prorealtime ............................................................................... 58 Figura 4-4-Velas. Fuente: Prorealtime................................................................................. 59 Figura 4-5-Soporte ................................................................................................................... 60 Figura 4-6-Resistencia............................................................................................................. 60 Figura 4-7-Bollinger. Fuente: Prorealtime .......................................................................... 66 Figura 4-8-Media móvil. Fuente: Prorealtime ................................................................... 67 Figura 5-1-Arquitectura Red ................................................................................................. 80 Figura 5-2-Funciones activación .......................................................................................... 83 Figura 5-3-Esquema-capas .................................................................................................... 89 Figura 5-4-Punto de parada .................................................................................................. 94 Figura 6-1-Esquema RNA ................................................................................................... 101 Figura 6-2-Funciones activación MATLAB ..................................................................... 102 Figura 6-3-Múltiples entradas ............................................................................................ 103 Figura 6-4-Notación abreviada RNA ................................................................................ 104 Figura 6-5-Esquema RNA ................................................................................................... 104 Figura 6-6-Notación abreviada........................................................................................... 105 Figura 6-7-RNA tres capas .................................................................................................. 106

xvii


Figura 6-8-RNA tres capas abreviadas ............................................................................. 107 Figura 6-9-nnstart .................................................................................................................. 108 Figura 6-10-More information ............................................................................................ 109 Figura 6-11-Red NARX ........................................................................................................ 109 Figura 6-12-Red NAR ........................................................................................................... 110 Figura 6-13-Red no lineal ..................................................................................................... 110 Figura 6-14-ntstool................................................................................................................. 111 Figura 6-15-Select data.......................................................................................................... 112 Figura 6-16-Inputs/Targets .................................................................................................. 113 Figura 6-17-Validation and test data ................................................................................. 114 Figura 6-18-Arquitectura NARX ........................................................................................ 115 Figura 6-19-Entrenamiento RNA ....................................................................................... 116 Figura 6-20-RNA entrenada ................................................................................................ 117 Figura 6-21-Entrenamiento RNA ....................................................................................... 118 Figura 6-22-Error entrenamiento ....................................................................................... 118 Figura 6-23 ............................................................................................................................... 119 Figura 6-24 ............................................................................................................................... 119 Figura 7-1-Diagrama flujo.................................................................................................... 121 Figura 7-2-Plantilla IMP/OUT............................................................................................. 124 Figura 7-3-Inputs ................................................................................................................... 124 Figura 7-4-Targets.................................................................................................................. 125 Figura 7-5-Cotización............................................................................................................ 125 Figura 7-6 ................................................................................................................................. 126 Figura 7-7 ................................................................................................................................. 127 Figura 8-1-DAX ...................................................................................................................... 132

xviii


Figura 8-2-DAX ...................................................................................................................... 132 Figura 8-3-DAX ...................................................................................................................... 133 Figura 8-4-DAX ...................................................................................................................... 133 Figura 8-5-DAX ...................................................................................................................... 134 Figura 8-6-DAX ...................................................................................................................... 134 Figura 8-7-DAX ...................................................................................................................... 135 Figura 8-8-DAX ...................................................................................................................... 135 Figura 8-9-DAX ...................................................................................................................... 136 Figura 8-10-DAX.................................................................................................................... 136 Figura 8-11-DJIA .................................................................................................................... 137 Figura 8-12-DJIA .................................................................................................................... 137 Figura 8-13-DJIA .................................................................................................................... 138 Figura 8-14-DJIA .................................................................................................................... 138 Figura 8-15-DJIA .................................................................................................................... 139 Figura 8-16-DJIA .................................................................................................................... 139 Figura 8-17-DJIA .................................................................................................................... 140 Figura 8-18-DJIA .................................................................................................................... 140 Figura 8-19-DJIA .................................................................................................................... 141 Figura 8-20-DJIA .................................................................................................................... 141 Figura 8-21-IBEX .................................................................................................................... 142 Figura 8-22-IBEX .................................................................................................................... 142 Figura 8-23-IBEX .................................................................................................................... 143 Figura 8-24-IBEX .................................................................................................................... 143 Figura 8-25-IBEX .................................................................................................................... 144 Figura 8-26-IBEX .................................................................................................................... 144

xix


Figura 8-27-IBEX .................................................................................................................... 145 Figura 8-28-IBEX .................................................................................................................... 145 Figura 8-29-IBEX .................................................................................................................... 146 Figura 8-30-IBEX .................................................................................................................... 146 Figura 8-31-NASDAQ .......................................................................................................... 147 Figura 8-32-NASDAQ .......................................................................................................... 147 Figura 8-33-NASDAQ .......................................................................................................... 148 Figura 8-34-NASDAQ .......................................................................................................... 148 Figura 8-35-NASDAQ .......................................................................................................... 149 Figura 8-36-NASDAQ .......................................................................................................... 149 Figura 8-37-NASDAQ .......................................................................................................... 150 Figura 8-38-NASDAQ .......................................................................................................... 150 Figura 8-39-NASDAQ .......................................................................................................... 151 Figura 8-40-NASDAQ .......................................................................................................... 151 Figura 8-41-NIKKEI .............................................................................................................. 152 Figura 8-42-NIKKEI .............................................................................................................. 152 Figura 8-43-NIKKEI .............................................................................................................. 153 Figura 8-44-NIKKEI .............................................................................................................. 153 Figura 8-45-NIKKEI .............................................................................................................. 154 Figura 8-46-NIKKEI .............................................................................................................. 154 Figura 8-47-NIKKEI .............................................................................................................. 155 Figura 8-48-NIKKEI .............................................................................................................. 155 Figura 8-49-NIKKEI .............................................................................................................. 155 Figura 8-50-NIKKEI .............................................................................................................. 156 Figura 8-51-S&P500 ............................................................................................................... 157

xx


Figura 8-52-S&P500 ............................................................................................................... 157 Figura 8-53-S&P500 ............................................................................................................... 158 Figura 8-54-S&P500 ............................................................................................................... 158 Figura 8-55-S&P500 ............................................................................................................... 159 Figura 8-56-S&P500 ............................................................................................................... 159 Figura 8-57-S&P500 ............................................................................................................... 160 Figura 8-58-S&P500 ............................................................................................................... 160 Figura 8-59-S&P500 ............................................................................................................... 160 Figura 8-60-S&P500 ............................................................................................................... 161 Figura 8-61-Análisis global.................................................................................................. 162 Figura 8-62-Evolución cartera............................................................................................. 163

xxi


Notación

A*

Conjugado

c.t.p.

En casi todos los puntos

c.q.d.

Como queríamos demostrar

Como queríamos demostrar

e.o.c.

En cualquier otro caso

e

número e

IRe

Parte real

IIm

Parte imaginaria

sen

Función seno

tg

Función tangente

arctg

Función arco tangente

sen

Función seno

sin y

Función seno de x elevado a y

cos y

Función coseno de x elevado a y

x

x

xxii


Sa

Función sampling

sgn

Función signo

rect

Función rectángulo

Sinc

Función sinc

∂y ∂x

Derivada parcial de y respecto

x◦

Notación de grado, x grados.

Pr(A)

Probabilidad del suceso A

SNR

Signal-to-noise ratio

MSE

Minimum square error

:

Tal que

<

Menor o igual

>

Mayor o igual

\

Backslash

Si y sólo si

xxiii



1. OBJETO DEL PROYECTO – ¿Usted haría barcos que navegaran contra las corrientes y los vientos con sólo encender una caldera bajo la cubierta? – Discúlpeme, no tengo tiempo para escuchar tonterías. Napoleón, hablando del barco de vapor de Robert Fultan.

El objeto de este Proyecto Fin de Máster es aportar métodos de previsión avanzados utilizados en Ingeniería para su uso en los Mercados Financieros. No obstante, no debe tenerse en cuenta sólo la previsión obtenida en este proyecto para abrir/cerrar una posición, son muchos los factores que influyen en el trading y han de tenerse en cuenta. La previsión de las cotizaciones se realiza en un timeframe semanal, siendo dicha previsión el precio de cierre del viernes de la siguiente semana. Para ello se utiliza una Red Neuronal Artificial tipo NARX, cuyos parámetros de entrada son puramente técnicos (indicadores y volúmenes), dicha Red se programa en Matlab y los resultados obtenidos se analizan posteriormente en una plantilla de Excel. Se realiza un testeo de la Red Neuronal analizando los principales Índices mundiales como el IBEX 35, DAX 30, NIKKEI 225, DOW JONES, S&P 500 y NASDAQ. La ventaja de analizar Índices en lugar de acciones individuales es que los Índices siguen patrones y tendencias, y por tanto se prestan mejor a previsiones según análisis técnico. El tiempo dedicado por el algoritmo para cada previsión es de 55 segundos aproximadamente, un tiempo muy razonable ya que las previsiones son semanales. El porcentaje de aciertos en la tendencia es del 66.6%, aportando una rentabilidad global del 9.48% anual Para ello se divide el proyecto en 9 capítulos, en los cinco primeros se realizan

25


introducciones a los mercados financieros, los productos derivados, se analizan los principales Índices bursátiles e introducen las redes neuronales y sus conceptos principales. En los tres siguientes capítulos se plantea, resuelve y analiza los resultados obtenidos, y por último se realiza una conclusión con los principales resultados obtenidos.


27

Introducción

2. INTRODUCCIÓN “El 90% del éxito se basa simplemente en insistir” Woody Allen

Desde hace años los economistas han estudiado e intentado comprender los movimientos de los precios en la bolsa de valores, debido a que las inversiones en bolsa están sujetas a riesgos, los rendimientos son variables y su existencia es cuanto menos incierta. La predicción de las cotizaciones o tendencias es un tema de interés. Sería muy provechoso poder predecir las tendencias y, si fuera posible, el precio de los activos, ya que con esta información los traders podrían realizar movimientos apropiados y así generar beneficios, el llamado market-timing. La Bolsa de Valores es una organización privada que brinda las facilidades necesarias para que sus miembros, atendiendo los mandatos de sus clientes, introduzcan órdenes y realicen negociaciones de compra y venta de valores, tales como acciones de sociedades o compañías anónimas, bonos públicos y privados, certificados, títulos de participación y una amplia variedad de instrumentos de inversión. La negociación de los valores en los mercados bursátiles se hace tomando como base unos precios conocidos y fijados en tiempo real, en un entorno seguro para la actividad de los inversores y en el que el mecanismo de las transacciones está totalmente regulado, lo que garantiza la legalidad, la seguridad y la transparencia. Las bolsas de valores fortalecen al mercado de capitales e impulsan el desarrollo económico y financiero en la mayoría de los países del mundo, donde existen en algunos casos desde hace siglos, a partir de la creación de las primeras entidades de este tipo creadas en los primeros años del siglo XVII. La institución Bolsa de Valores, de manera complementaria en la economía de los países, intenta satisfacer tres grandes intereses: 

El de la empresa, porque al colocar sus acciones en el mercado y ser


adquiridas por el público, obtiene de este el financiamiento necesario para cumplir sus fines y generar riqueza. 

El de los ahorradores, porque estos se convierten en inversores y pueden obtener beneficios gracias a los dividendos que les reportan sus acciones.

El del Estado, porque el Estado dispone de un medio para financiarse y hacer frente al gasto público, así como adelantar nuevas obras y programas de alcance social.

Los participantes de la Bolsa son básicamente los demandantes de capital (empresas, organismos públicos o privados y otras entidades), los oferentes de capital (ahorradores, inversionistas) y los intermediarios Por lo tanto, predecir las tendencias de los Mercados Financieros representa un gran reto y en las últimas dos décadas ello ha sido objeto de muchos estudios dadas las aplicaciones comerciales que tiene. Numerosos métodos han sido propuestos para brindar predicciones más precisas a los inversores. Algunos de estos estudios han utilizado modelos autorregresivos, promedios móviles, Arima, regresión múltiple, algoritmo genético, suavizado exponencial, métodos lineales y no lineales, entre otros. En el presente proyecto se intentará predecir cotizaciones y tendencias usando Redes Neuronales Artificiales (RNA) tipo NARX, un método novedoso en este campo y con un amplio abanico de aplicaciones.


29

Contexto de los Mercados Financieros

3. CONTEXTO DE LOS MERCADOS FINANCIEROS “Cada día sabemos más y entendemos menos” - Albert Einstein -

En este capítulo se introducen los conceptos básicos para comprender el funcionamiento de los mercados bursátiles. En primer lugar se realiza una introducción a los mercados de valores en general, y las bolsas españolas en particular, para continuar con la descripción de la importancia que tienen los mercados dentro del sistema financiero, así como una introducción a los costes de operar en bolsa. A continuación se define el concepto de eficiencia de los mercados. Se mencionan algunos de los factores que afectan a la evolución de la bolsa y por qué la competencia entre los distintos agentes intervinientes en el mercado conduce a una situación de equilibrio en el precio de cualquier activo financiero.

3.1. La Bolsa de Valores La Bolsa de Valores es una organización privada que brinda las facilidades necesarias para que sus miembros, atendiendo los mandatos de sus clientes, introduzcan órdenes y realicen negociaciones de compra y venta de valores, tales como acciones de sociedades o compañías anónimas, bonos públicos y privados, certificados, títulos de participación y una amplia variedad de instrumentos de inversión. La negociación de los valores en los mercados bursátiles se hace tomando como


base unos precios conocidos y fijados en tiempo real, en un entorno seguro para la actividad de los inversores y en el que el mecanismo de las transacciones está totalmente regulado, lo que garantiza la legalidad, la seguridad y la transparencia.

3.1.1. Conceptos básicos de bolsa y los mercados de valores La bolsa es un mercado especializado en el que se brindan las facilidades necesarias para que se produzcan compras y ventas de acciones u obligaciones atendiendo a los mandatos de sus clientes, de tal manera que exista un precio, o cotización, equilibrado de los títulos negociados. Principalmente existen dos tipos de mercados en función del momento en el que se realiza la emisión de los valores. En este caso, los mercados se dividen en mercados primarios y mercados secundarios. •

El mercado primario, también llamado mercado de emisiones, se da cuando las entidades admitidas a cotización en bolsa emiten acciones u obligaciones que son adquiridas por inversores. En el mercado primario se relacionan de manera directa las entidades demandantes de capital con los oferentes de capital o inversores. Una vez colocadas las acciones, ya se inicia la cotización en bolsa, así los inversores que han adquirido acciones pueden venderlas en el momento en que lo deseen.

En el mercado secundario o mercado bursátil se produce la confrontación de ofertas y demandas de títulos ya emitidos. A través de la oferta y la demanda se fija el precio de los títulos de entidades que coticen en bolsa. Al mercado secundario se le denomina también bolsa de valores y serán las cotizaciones de ésta las que se estudiarán en este proyecto.

Vista esta clasificación de los mercados se observa que el mercado primario y el secundario están totalmente relacionados y para que la bolsa funcione de forma eficiente se precisa que cada uno de los dos mercados esté bien desarrollado. Las bolsas son por lo tanto mercados financieros en los que se negocian valores públicos o privados y cuya principal función es satisfacer las necesidades de los demandantes y de los oferentes de dinero. Para los inversores, las bolsas proporcionan básicamente una oportunidad para invertir capital. Y para las empresas e instituciones públicas que cotizan, la bolsa supone ampliar las


Contexto de los Mercados Financieros

31

posibilidades de financiación, además de ser una manera de obtener liquidez y de mejorar la imagen pública. Para mantener el equilibrio entre estas dos fuerzas enfrentadas, la bolsa no puede ser solamente un lugar donde comprar y vender, sino que es un sistema de organizaciones relacionadas entre sí y que está sujeto a unas condiciones que permiten determinar el precio de valores e instrumentos financieros. Para poner en relación a oferentes y demandantes están quienes actúan como intermediarios financieros en el mercado. La forma en que todos estos participantes interactúan entre sí, viene definida en la normativa que regula el funcionamiento del mercado de valores y que es muy extensa en nuestro país y ha sufrido alteraciones importantes para adaptarla a las corrientes de los mercados de valores más desarrollados, así como para adaptarla a directivas europeas sobre los mercados de instrumentos financieros.

3.1.2. Las Bolsas Españolas La Ley del Mercado de Valores, que es la normativa que rige la actividad bursátil, reconoce como mercados secundarios oficiales a las Bolsas de Madrid, Barcelona, Valencia y Bilbao. Cada una está regida y administrada por una sociedad anónima, cuyos accionistas son los miembros de las correspondientes bolsas. Es decir, las sociedades y agencias de valores, así como las entidades de crédito. Hasta 2009 la contratación directa en el parqué, realizando corros y fijando los precios de las cotizaciones a viva voz, convivía con el sistema electrónico, pero el escaso volumen negociado en ellos provocó su desaparición. Se dio paso al sistema de contratación a través de redes informáticas, donde los miembros de la bolsa introducen sus cotizaciones de compra y venta en el sistema, permitiéndose así operar con grandes volúmenes de contratación y una operativa más transparente y eficaz. La red que interconecta las bolsas españolas se denomina SIBE (Sistema de Interconexión Bursátil Electrónico). Este sistema permite a los miembros de las cuatro bolsas dirigir sus órdenes a través de terminales informáticos al mismo servidor central, además de asegurar un único punto de liquidez por valor en tiempo real. La dirección y administración del sistema SIBE corresponde a otra


sociedad anónima, la Sociedad de Bolsas, constituida por las Sociedades Rectoras de las cuatro Bolsas. El Mercado Continuo opera de 09:00 a 17:30, antes de las 9 se produce la preapertura en la que se calculan los precios de equilibrio entre oferta y demanda para asignar un precio de inicio de sesión, y durante los 5 minutos posteriores a las cinco y media se produce la subasta de cierre, donde se equilibra también la oferta y la demanda para definir el precio de cierre de la sesión. Los precios se fijan de la siguiente manera: 1.

En la subasta de apertura:

A la vista de las órdenes introducidas en el periodo de ajuste, el primer precio será aquel que permita negociar un mayor número de unidades de contratación; en el caso de que dos o más precios permitan negociar el mismo número, el primer precio será el que produzca el menor desequilibrio, entendiéndose por desequilibrio la diferencia entre el volumen ofrecido y el volumen demandado a un mismo precio. Si no hay desequilibrio o si los desequilibrios son iguales, se escogerá el precio del lado que tenga mayor volumen. Si las tres condiciones anteriores coinciden, se escogerá como precio de la subasta el más cercano al último negociado con las excepciones siguientes: 

En el caso de que el último precio negociado esté dentro de la horquilla de los dos posibles precios de la subasta, el precio de la subasta será ese último precio negociado.

De no haber último precio negociado o encontrarse éste fuera de la horquilla de precios del rango estático, el precio de la subasta será el más cercano al precio estático.

Una vez fijado el primer precio se ejecutarán las órdenes en el siguiente orden: 

Órdenes de mercado, que son aquellas que se ejecutan al precio actual del mercado.

Órdenes por lo mejor. Al igual que en las órdenes de mercado, se asume el mejor precio ofrecido en el momento de su edición, la diferencia está en que en el caso de que al mejor precio no existan títulos suficientes para atender a la propuesta, esta se liquidará de forma parcial, quedando el resto limitado a dicho precio.


Contexto de los Mercados Financieros

33

Órdenes limitadas. Son aquellas que se definen con un precio máximo para la compra y mínimo para la venta. En primer lugar se ejecutan aquellas con precios mejores que el de subasta.

Resto de órdenes limitadas al precio de subasta, en la medida que sea posible, según el orden temporal en el que se introdujeron en el sistema.

2.

Durante la sesión abierta:

Si finalizada la subasta de apertura, no coincidieran la oferta y la demanda, el valor podrá negociar durante la sesión tan pronto se cumpla la condición citada. En la sesión abierta, las contrapartidas que cierren operaciones se distribuirán entre las órdenes que integren la posición dominante, según rango de precios y, a igualdad de precios, según prioridad temporal. Para compensar y liquidar las operaciones se creó otra sociedad anónima: el Servicio de Compensación y Liquidación de Valores (SCLV), que tras su fusión con la Central de Anotaciones del Banco de España (CADE), ha pasado a denominarse Iberclear2. Iberclear es el Depositario Central de Valores español, encargado del registro contable y de la compensación y liquidación de los valores admitidos a negociación en las bolsas de valores españolas (Madrid, Barcelona, Bilbao y Valencia), Latibex y AIAF. Todas estas sociedades pertenecen actualmente a Bolsas y Mercados Españoles (BME), una compañía que cotiza en el mercado desde 2006, y que, disfrutó de monopolio en sus funciones hasta 2008. Actualmente, la normativa europea de mercados financieros (MiFID), permite a otras plataformas de negociación bursátil, como Turquoise o Chi-X, funcionar en el mercado español como alternativa a la gestión de BME. Las principales sociedades que componen Bolsas y Mercados Españoles son: 

Bolsa de Barcelona

Bolsa de Bilbao

Bolsa de Madrid

Bolsa de Valencia


Iberclear

MEFF

AIAF

Latibex

Mercado Alternativo Bursátil (MAB)

Infobolsa

BME Innova

BME Market Data

Instituto BME

Finalmente, la Comisión Nacional del Mercado de Valores (CNMV) actúa como órgano de supervisión e inspección de los mercados de valores españoles y de la actividad de cuantos intervienen en los mismos. Ejerce su potestad sancionadora en caso de incumplimiento de las normas del mercado. La CNMV fue creada por la Ley 24/19883 del Mercado de Valores, que supuso una profunda reforma de este segmento del sistema financiero español. Las Leyes 37/19984 y 44/20025 han venido a actualizar la anterior, estableciendo un marco regulador adaptado a las exigencias de la Unión Europea, propicio para el desarrollo de los mercados de valores españoles en el entorno europeo, e incorporando nuevas medidas para la protección de los inversores. El objetivo de la CNMV es velar por la transparencia de los mercados de valores españoles y la correcta formación de precios, así como la protección de los inversores. La CNMV, en el ejercicio de sus competencias, recibe un importante volumen de información de y sobre los intervinientes en los mercados, gran parte de la cual está contenida en sus Registros Oficiales y tiene carácter público. La acción de la Comisión se proyecta principalmente sobre las sociedades que emiten u ofrecen valores para ser colocados de forma pública, sobre los mercados secundarios de valores, y sobre las empresas que prestan servicios de inversión y las instituciones de inversión colectiva. Sobre estas últimas, así como sobre los mercados secundarios de valores, la CNMV ejerce una supervisión prudencial, que


Contexto de los Mercados Financieros

35

garantiza la seguridad de sus transacciones y la solvencia del sistema. La CNMV, a través de la Agencia Nacional de Codificación de Valores, asigna códigos ISIN y CFI, con validez internacional, a todas las emisiones de valores que se realizan en España6.

3.1.3. Funciones de la Bolsa dentro del sistema financiero Algunas de las funciones de una Bolsa de Valores son: a)

Función de canalización del ahorro.

Como ya se ha mencionado, la bolsa brinda los mecanismos necesarios para relacionar a oferentes y demandantes de capital. Así, la bolsa pone en contacto a las empresas con los ahorradores y genera un traspaso de capitales entre estos y aquéllas. b) Función de liquidez. Aunque no todos los valores comerciados en los mercados tienen la misma liquidez, los titulares de estos valores pueden venderlos y convertirlos en dinero, cobrar su liquidación, en cualquier momento con rapidez y facilidad gracias a la bolsa y toda su estructura. c)

Función social de movilización de la propiedad.

La difusión de las acciones en bolsa permite que los pequeños ahorradores puedan acceder al capital de grandes empresas. Si estas empresas no cotizasen en bolsa, difícilmente el pequeño inversor podría haber accedido a su propiedad. d) Función de estimación. Por una parte, la bolsa se considera un instrumento central para valorar los rendimientos en la economía capitalista. Los movimientos de la bolsa son un barómetro de las perspectivas económicas del país. Si la bolsa va mal, los políticos, empresarios y público en general saben que algo no funciona en la economía. Desde otro punto de vista más concreto, la bolsa contribuye a la fijación del valor de las empresas al establecerse un precio bursátil o precio de mercado,


que tiene su importancia a efectos de compra-venta de empresas y activos. A través de ese precio es posible aplicar lo que se denomina como «mark to market», que es el sistema aprobado por las normativas internacionales de contabilidad para dar valor a las posiciones en instrumentos financieros a partir del precio que tengan en el mercado. Además, también constituye el mejor elemento de juicio sobre la mayor o menor eficacia de la gestión empresarial y advierte a los accionistas sobre la validez o no de los gestores elegidos. Sin embargo, se debe tener en cuenta que la cotización de los valores (sobre todo de los grandes) está cada vez más sujeta al comportamiento general del mercado, debido a la mayor globalización de las economías mundiales. De esta manera, la bolsa se convierte así en instrumento probatorio de la eficacia en la gerencia de las empresas y de control de la gestión por parte de los accionistas y del público en general. e)

Función aseguradora.

La bolsa protege al público ahorrador frente al fraude, al existir un mercado organizado, y regulado, que se rodea de unas garantías y publicidad. Si no existiesen esas garantías del mercado bursátil, el inversor privado difícilmente se arriesgaría a invertir. f)

Función informativa y formativa de estados de opinión.

Toda la información de las cotizaciones es pública, y los inversores disponen de ella para formarse una idea clara del valor de las sociedades en las que invierte. A través de los índices de precios y de negociación, es posible conocer estados de opinión colectiva que de otra forma no serían detectables. g) Función de protección del ahorro frente a la inflación. Lo habitual es que los beneficios y los dividendos de las empresas sólidas crezcan al mismo tiempo que los demás precios y ese crecimiento se refleja en sus cotizaciones bursátiles. Eso supone que la inversión en acciones permite al ahorro evitar la erosión monetaria.

3.1.4. Coste de las operaciones en bolsa El coste que un inversor debe asumir al llevar a cabo una compraventa en el mercado español es el resultado de sumar los siguientes tres tipos de gastos:


Contexto de los Mercados Financieros

37

Las comisiones recibidas por la entidad o las entidades intermediarias.

Los cánones de contratación de la Bolsa.

La comisiones del Servicio de Compensación y Liquidación de Valores (SCLV), de cuya prestación se encarga Iberclear.

Además, se debe tener en cuenta el coste de la administración o custodia de los valores, que también supone el pago de comisiones al intermediario que los gestiona. Esta tarea la pueden llevar a cabo tanto la entidad bancaria como la sociedad o agencia de valores.

3.1.5. Derivados Un derivado financiero es un activo financiero cuya valor cambia se deriva de los cambios en otro activo, llamado activo subyacente. Existen multitud de posibles subyacentes: Materias Primas, Índices, Valores de Renta Fija y Renta Variable, Tipos de Interés, Tipos Interbancarios. Otras características de estos productos son: 

No requiere una gran inversión inicial, o ésta es muy pequeña en relación a la inversión necesaria si se quisiera negociar directamente con el activo subyacente (Apalancamiento Financiero).

Se liquida, generalmente, en una fecha futura. (A plazo)

Los principales tipos de Derivados son Swaps, Futuros y Forwards, y Opciones. En la siguiente Figura 3-1 se muestra un esquema de los derivados financieros, en el que se pueden ver los distintos productos clasificados según sus respectivos activos subyacentes, tipos de mercado y tipo de derivado:


Figura 3-1-comparación_derivados

3.1.5.1. Principales usos Los principales usos de los instrumentos derivados son: 

Cobertura: para reducir o eliminar el riesgo que se deriva de la fluctuación del precio del activo subyacente (Ejemplo: un granjero y un molinero que realizan un contrato de futuros sobre la compraventa de grano a un precio determinado, para evitar posibles subidas/bajadas del precio del grano)

Especulación: se pretende obtener beneficio por las diferencias previstas en las cotizaciones, minimizando la aportación de fondos a la inversión. Hay que tener en cuenta que por el alto grado de apalancamiento que suponen, el efecto multiplicativo tanto en las posibles ganancias como pérdidas es muy importante. (La participación ordenada de especuladores en los mercados no es necesariamente negativa, pues dota a los mismos de liquidez, profundidad, estabilidad, ayuda a la fijación eficiente de precios, y en muchos casos actúa como contrapartida de alguien que realiza una operación de cobertura).

Arbitraje: una operación genuina de arbitraje se basa en la ejecución de una estrategia cruzada de intercambios en la que se produce un beneficio neto


Contexto de los Mercados Financieros

39

positivo. Suelen tener un carácter temporal corto y obedecen a ineficiencias de mercado.

3.1.6. CFDs El contrato por diferencia (en inglés Contract for difference, CFD) es un contrato por el que se intercambia la diferencia del precio de un instrumento financiero en el momento de apertura del contrato y el precio en el momento de cierre del mismo. Fue creado en Reino Unido durante la década de 1950 por los fondos de inversión para tener acceso libre a la negociación de operaciones con mucho apalancamiento. Se trata de un producto que se ha ofrecido tardíamente al pequeño inversor, y que en España se ha comenzado a comercializar desde el año 2007. Sin embargo en el Reino Unido, donde los CFD para clientes particulares ya llevan funcionando desde hace muchos años, están muy difundidos. Valgan estos datos referidos a la Bolsa de Londres de 2008 como ilustración: 

La contratación de CFD ha crecido en los últimos años un 57% anual.

Un 35% de la contratación total actual de la Bolsa de Londres tiene su origen en contratos de CFD, siendo el pequeño inversor protagonista de un 20% de los CFD transaccionados.

El CFD refleja el rendimiento de dicho activo, por ejemplo acciones, materias primas, índices, divisas o tipos de interés, entre otros, sin la necesidad de tener la propiedad física del instrumento subyacente en sí. Los CFD son instrumentos derivados OTC (over the counter), es decir, no cotizan en un mercado organizado. Originariamente, los CFD únicamente eran accesibles al inversor institucional. Hoy en día los CFD se han convertido en una herramienta de negociación muy popular entre los pequeños inversores de todo el mundo. Los CFD están ganando terreno a la inversión tradicional gracias a sus ventajas, flexibilidad a la hora de operar y fácil acceso a mercados tradicionalmente no accesibles al cliente minorista. Los CFD exigen el depósito por parte del inversor de un pequeño importe en concepto de garantías, esto le permite una gestión más eficiente de su capital, ya que sólo se moviliza una pequeña proporción del valor global de su posición.


3.2. Eficiencia de los mercados Los mercados de valores se dice que son eficientes porque la competencia entre los distintos agentes que intervienen en el mismo, guiados por el principio del máximo beneficio, conduce a una situación de equilibrio en la que en todo momento el precio de cualquier activo financiero constituye una buena estimación de su valor intrínseco o real. Para conseguir que exista ese equilibrio se consideran básicas las siguientes condiciones de eficiencia de un mercado: 

Homogeneidad de los valores negociables. Una acción de una empresa es idéntica a otra de la misma serie o clase emitida por dicha empresa.

Ha de ser un mercado con gran cantidad de compradores y vendedores. Al existir un volumen mínimo de contratación y una distribución de los títulos en muchas manos, ningún inversor o desinversor individual tendrá el suficiente poder para influir sobre las cotizaciones.

Ha de permitirse libremente la salida y entrada del mercado. La libertad de transmisión de los valores negociables ha de ser una de las condiciones para las empresas que accedan al mercado.

Ha de ser un mercado donde exista información fiable, veraz y pública de las empresas que cotizan y del desarrollo, precios y situación de la propia bolsa.

El número de valores admitidos a cotización en el mercado ha de ser lo más amplio posible, a fin de que los inversores puedan diversificar y reducir así sus riesgos.

La necesidad de una moderada especulación en el mercado, que implica que los especuladores (aquellos inversores que operan con un horizonte de inversión muy corto en función del sesgo de determinadas noticias puntuales) pueden dar contrapartida y liquidez en los movimientos a corto plazo de los inversores a largo plazo. Si toda la inversión fuese a medio y largo plazo, sería difícil encontrar contrapartida en el momento para quien desease hacer liquidez. La especulación incrementa la actividad bursátil y favorece la oferta y demanda de valores negociables.

La uniformidad y tipificación de las operaciones permite simplificarlas y


Contexto de los Mercados Financieros

41

agilizarlas, a fin de que el mercado funcione con mayor eficacia y rapidez. Todas estas condiciones hacen que en los mercados estén perfectamente valorados todos los títulos, por lo que no existirán títulos sobre o infravalorados. Esto se debe a que el precio de los activos negociados en los mercados financieros refleja toda la información conocida por los miembros de los mercados y todas las creencias de los inversores sobre el futuro, de modo que el precio se ajusta rápidamente a los nuevos datos que puedan surgir. Entonces, en un hipotético equilibrio en el que la información pasada, presente y futura está incorporada al precio de los activos ocurre que no es posible lograr de forma consistente superar los resultados del mercado excepto a través de la suerte o de la información privilegiada, siendo por lo tanto aleatorio el precio de las acciones e imposible conocerlo por adelantado. En un mercado eficiente las múltiples estimaciones del valor de un mismo activo financiero deben oscilar de forma aleatoria en torno a su verdadero valor intrínseco y deben seguir una trayectoria incierta. Esto es lo que se denomina "Teoría del paseo aleatorio". Según la teoría del paseo aleatorio, no existen tendencias predecibles en los precios de las acciones o títulos valores que puedan utilizarse para "enriquecerse rápidamente" La clave de la eficiencia de un mercado está en la cantidad de información que se genera en él y en la velocidad con la que el precio de los activos la incorpora, cuanta más información y más rápidamente se incorpore a los precios, más eficiente es el mercado. En los mercados poco eficientes los precios incorporan muy lentamente la nueva información, haciendo que existan discrepancias de carácter no aleatorio entre el precio de un título y su valor intrínseco o real. Esta ineficiencia es aprovechada por algunos inversores para conseguir beneficios superiores a los de la media del mercado, entonces estos inversores explotarán dichas diferencias en su favor hasta que de nuevo el mercado las haga desaparecer. La hipótesis de eficiencia de los mercados es una pieza central de la teoría de los mercados eficientes. Harry Roberts (1967) definió tres niveles de eficiencia de los mercados de valores, donde cada nivel reflejaba la clase de información que era rápidamente reflejada en el precio. Estos niveles de eficiencia eran denominados: débil, intermedio y fuerte. A continuación se describen los diferentes niveles mencionados.


3.2.1. La hipótesis débil del mercado eficiente En la hipótesis débil se supone que cada título refleja totalmente la información contenida en la serie histórica de precios, es decir, toda la información pasada. Los inversores, por lo tanto, no pueden obtener rentabilidades superiores analizando dichas series (es decir, utilizando el análisis técnico, que se basa en el estudio de los gráficos representativos de la evolución pasada del precio) o ideando reglas de comportamiento de los precios basadas en ellas, puesto que todos los participantes del mercado habrán aprendido ya a explotar las señales que dichas series de precios pueden mostrar y actuarán en consecuencia. Según esta hipótesis ningún inversor podrá conseguir un rendimiento superior al del promedio del mercado analizando exclusivamente la información pasada y si lo logra será sólo por azar. Ahora bien, si el mercado se ajusta a esta hipótesis, un inversor sí podrá "batir al mercado" utilizando la información hecha pública y la información privilegiada.

3.2.2. La hipótesis intermedia del mercado eficiente Según esta hipótesis un mercado es eficiente en su forma intermedia cuando los precios reflejan, no sólo toda la información pasada, sino también toda la información hecha pública acerca de la empresa o de su entorno, que pueda afectar a cada título en particular (informe de resultados, anuncios de dividendos, balances anuales, trimestrales, variación del tipo de interés, etc.). Dado que una gran parte de la información utilizada por los analistas financieros está ampliamente disponible para el público, si la eficiencia del mercado se ajusta a dicha hipótesis, la persona que emplee el análisis fundamental para intentar lograr un rendimiento superior a la media del mercado no conseguiría beneficio por encima de la media, puesto que la cotización de los títulos ya refleja exactamente su valor teórico o intrínseco. La única forma de lograr un rendimiento superior al promedio, que no sea por medio del azar, es a través de la utilización de la información privilegiada.


Contexto de los Mercados Financieros

43

3.2.3. La hipótesis fuerte del mercado eficiente La hipótesis fuerte parte del supuesto de que los precios reflejan absolutamente toda la información ya sea pasada, pública o privada. Según ella, ningún inversor podrá "batir al mercado" como no sea por azar. Esta es una hipótesis extrema que es prácticamente imposible de cumplir en ningún mercado, pues ello implicaría que dicho mercado sería perfecto. Antes de continuar con el apartado siguiente es necesario hacer hincapié en que para que un mercado sea eficiente es necesario que los participantes en el mismo utilicen el análisis técnico (que busca formas en las series históricas de precios que sean recurrentes y, por tanto, predecibles) y el análisis fundamental (que utiliza las predicciones de beneficios y dividendos de la empresa, las expectativas sobre los tipos de interés y la valoración del riesgo de la compañía para determinar el precio intrínseco de la acción) con objeto de que la competencia entre los analistas asegure que, como regla general, los precios de los títulos reflejarán toda la información disponible. Por supuesto, si el mercado llega a ser eficiente en su forma intermedia todo el tiempo y dinero empleado en los dos tipos de análisis anteriores se habrá gastado en vano, pero si los analistas pensaran que el mercado es eficiente y renunciaran a realizar sus análisis entonces seguro que el mercado llegaría a ser rápida y completamente ineficiente. En resumen, los mercados se aproximan a la eficiencia cuando los participantes en los mismos creen que no son eficientes y compiten buscando esa ineficiencia que les hará ganar una mayor rentabilidad que el promedio de los inversores.

3.2.4. Información influyente en los mercados financieros La expectativa de obtener mayor rendimiento o rentabilidad que en productos alternativos es lo que hace invertir, puede decirse que en realidad se compran las expectativas de una rentabilidad. Estamos en un mercado eficiente y las expectativas se ven influenciadas por cualquier noticia que se hace pública. Se puede decir que los valores descuentan la información mucho antes de que se produzcan los hechos constitutivos de tal información. Una frase muy usada en los mercados es ‘’buy the rumour and sell the fact” (comprar con el rumor y vender con la noticia). Esto se debe a que cuando las noticias aparecen el valor ya recoge en su precio lo bueno o malo de tal


información. Mencionar todos aquellos factores que influyen en la evolución del precio de un valor sería difícil, son demasiados, pero sobre todo porque hay algunos lo suficientemente subjetivos como para ser imprevisibles. Es por ello que se hará referencia a aquellos que de forma más o menos objetiva influyen directamente en ese comportamiento. Por un lado están los factores intrínsecos, que son los que se encuentran en la misma bolsa y están relacionados con los valores que en ella se contratan. Entre estos factores se encuentran el volumen y la frecuencia de contratación, la amplitud o estrechez del mercado, la rentabilidad del valor, los niveles máximos y mínimos de contratación, los precios anteriores, la posición del mercado a crédito, la psicología especial del inversor en bolsa y la diversificación de la inversión en varios valores. Por otra parte, los factores extrínsecos al mercado son los que se encuentran fuera del mismo y pueden ser económicos, sociales y políticos: a)

La coyuntura económica La bolsa es un buen índice de la coyuntura económica, pero se utiliza al mismo tiempo como factor de predicción del futuro desarrollo de la economía, dado que en la bolsa cotizan expectativas.

b) Los tipos de interés y el mercado monetario El mercado monetario podría definirse sencillamente como la oferta y demanda de activos financieros a corto plazo. En nuestro país sería el constituido básicamente por pagarés, letras y certificados de depósito. La dependencia de la bolsa con respecto a los activos financieros a corto plazo es obvia, ya que existe una competencia de inversión. Si los tipos de interés son demasiado bajos, la rentabilidad será baja en los activos financieros y no interesará invertir en ellos, con lo que en consecuencia se producirá un movimiento de fondos desde los activos de renta fija a los de renta variable haciendo que mayores rentabilidades compensen el mayor riesgo que implica la inversión en bolsa. Con tipos de interés altos ocurrirá lo contrario. Por otro lado los tipos de interés deberían influir en los balances de las


Contexto de los Mercados Financieros

45

empresas, especialmente en las más endeudadas, porque con tipos altos, el coste de su deuda aumenta. Las bajadas de tipos les favorecen al tener que pagar menos intereses y por lo tanto su valor en bolsa aumenta. c)

Los resultados empresariales En bolsa son los beneficios futuros y no los pasados los que realmente interesan, pero los ejercicios anteriores nos dan información sobre la salud de una empresa, su evolución positiva o negativa y de la solidez de la misma. Así podemos evaluar la recurrencia de los beneficios de la empresa o, lo que es lo mismo, la capacidad que tiene la compañía para generar beneficios a lo largo del tiempo. La información que las empresas cotizadas tienen obligación de publicar se divide en: 

Cuenta de Pérdidas y Ganancias.

Balance de situación.

Estado de Origen y Aplicación de Fondos.

En general, el estudio de los datos particulares de una empresa lo realiza el análisis fundamental, que se introducirá más adelante. d) La política monetaria Condiciona la remuneración y la expansión o control de la masa monetaria. Por tanto, para anticipar los movimientos de los bancos centrales, podemos vigilar la evolución de la M3, la masa monetaria en circulación, que incluye el nivel de dinero en efectivo además de los depósitos bancarios. Porque, en términos generales, las autoridades monetarias de todo el mundo intentan controlar la estabilidad de precios y la existencia de mucha masa monetaria en circulación implica subida de la inflación. La política monetaria influye en las cotizaciones bursátiles, fundamentalmente en lo referente a las tasas de interés, por lo señalado anteriormente. También repercute en lo relativo a las disponibilidades líquidas del sistema, ya que cuanto mayor sea el crecimiento de la masa monetaria, mayores podrán ser las disponibilidades líquidas del sistema financiero dirigidas a la bolsa.


e)

La inflación La inflación conlleva una subida de precios constante, continua y elevada, desalienta el ahorro y afecta a toda inversión, fundamentalmente a la renta fija porque la inflación afecta tanto al capital como a los intereses. Ambos se ven erosionados por el efecto de la inflación. Cuanto más baja sea la inflación mejor, tanto para la bolsa como para la renta fija. Pero la inflación, aunque sea baja, siempre perjudica a la renta fija y sin embargo la bolsa es una protección ante ella. Lo habitual es que los beneficios y los dividendos de las empresas sólidas crezcan al mismo tiempo que los demás precios y ese crecimiento se refleja en sus cotizaciones bursátiles. Eso supone que los accionistas de esas empresas aumentan su poder adquisitivo por encima de la inflación. En conclusión, el ahorrador a medio y largo plazo se defiende ante la inflación con más efectividad invirtiendo en acciones que si lo hace en obligaciones y bonos de renta fija.

f)

La economía mundial Todas las bolsas del mundo están relacionadas, y por tanto, el comportamiento de todas ellas está influido por variables financieras, economías y políticas.

g) Tensiones políticas Una situación de inestabilidad política internacional no favorece el funcionamiento de los mercados bursátiles, ya que en situaciones de riesgo los inversores internacionales suelen repatriar sus inversiones, aunque sea asumiendo pérdidas, lo cual provoca las caídas de las cotizaciones en las bolsas dependientes de esta inversión exterior.

3.3. Principales Índices mundiales Un índice bursátil corresponde a un registro estadístico compuesto usualmente de un número, que trata de reflejar las variaciones de valor o rentabilidades promedio de las acciones que lo componen. Generalmente, las acciones que componen el índice tienen características comunes tales como: pertenecer a una misma bolsa de


Contexto de los Mercados Financieros

47

valores, tener una capitalización bursátil similar o pertenecer a una misma industria. Estas son usualmente usadas como punto de referencia para distintas carteras, tales como los fondos mutuos.

3.3.1. Historia El índice estadounidense más antiguo existente hoy en día es el Dow Jones Industrial Average o simplemente conocido como Dow Jones. Éste mismo fue creado por Charles Henry Dow en conjunto con el Wall Street Journal para medir la actividad económica y financiera de los Estados Unidos de América a finales del siglo XIX. Al principio estaba compuesto tan solo por 12 compañías como General Electric, North American Company o American Tobacco Company entre otras. Hoy en día está formado por 30 compañías. Porcentaje de acciones de las empresas más representativas de los países.

3.3.2. Índices bursátiles en el mundo Los principales índices bursátiles del mundo son: Asia 

SSE Composite Index (Shanghái, China)

Hang Seng (Hong Kong)

Nikkei 225 (Tokio, Japón)

Kospi (Seúl, Corea del Sur)

Australian Securities Exchange (Sídney, Australia)

Europa 

FTSE MIB (Milan, Italia)

Ibex 35 (Madrid, España)

CAC 40 (París, Francia)


DAX 30 (Fránkfurt, Alemania)

FTSE 100 (Londres, Gran Bretaña)

AEX (Países Bajos)

SMI (Zúrich, Suiza)

América 

S&P/TSX 60 (Toronto, Canadá)

Dow Jones (Nueva York, EE. UU.)

S&P 500 (Nueva York, EE. UU.)

Nasdaq 100 (Nueva York, EE. UU.)

IPC (México)

IBES (El Salvador)

IGBC (Colombia)

IBC (Venezuela)

S&P/BVL Perú General Index (Perú)

Bovespa (Brasil)

Bolsa de Valores y Productos de Asunción (BVPASA) (Paraguay)

Merval (Argentina)

IPSA (Chile)


Contexto de los Mercados Financieros

49

3.4. FOREX El mercado de divisas, también conocido como Forex (abreviatura del término inglés Foreign Exchange). FX o Currency Market, es un mercado mundial y descentralizado en el que se negocian divisas. Este mercado nació con el objetivo de facilitar el flujo monetario que se deriva del comercio internacional. Es, por gran margen, el mercado financiero más grande del mundo, llegando a mover un volumen diario de transacciones de alrededor de cinco billones de dólares estadounidenses (USD), más que todos los demás mercados bursátiles del planeta combinados. Ha crecido tanto que, en la actualidad, el total de operaciones en moneda extranjera que se debe a operaciones internacionales de bienes y servicios representan un porcentaje casi residual, debiéndose la mayoría de las mismas a compraventa de activos financieros. En consecuencia este mercado es bastante independiente de las operaciones comerciales reales y las variaciones entre el precio de dos monedas no puede explicarse de forma exclusiva por las variaciones de los flujos comerciales. El mercado de divisas es único debido a: 

El volumen de las transacciones.

La liquidez extrema del mercado.

El gran número y variedad de los intervinientes en el mercado.

Su dispersión geográfica.

El tiempo en que se opera, 24 horas al día (excepto los fines de semana).

El cambio de horarios trading.

La variedad de factores que generan los tipos de cambio.

Básicamente, al ser las transacciones en Forex algo inmediato, lo que afecta a la cotización de las divisas es la ley de la oferta y la demanda y, por lo tanto, la especulación. Dentro de esto, la estabilidad y los eventos políticos y económicos, así como la política monetaria de los países, son algunos de los elementos definitorios de las cotizaciones. 

Acciones de agentes económicos privados y públicos.


Los órganos financieros, gobiernos y los bancos centrales de cada país pueden afectar directamente a la cotización de una moneda con determinadas medidas y anuncios económicos. Por ejemplo, una subida de tipos de la Fed (la Reserva Federal Norteamericana) haría que el valor de la divisa estadounidense aumentase. 

Eventos políticos, sociales y económicos. Si los actores en Forex creen que, debido a un determinado evento social, político, económico o natural una divisa se fortalecerá o debilitará, cambiarán el precio del mercado con sus operaciones, según cambie la oferta y la demanda de la divisa relevante. Cuanta más gente crea que se seguirá una determinada tendencia, mayor efecto tendrá sobre los precios del mercado, ya que reflejarán el sentimiento del mercado. Grandes eventos recientes como el Brexit o las elecciones de los EE.UU. incidieron directa e inmediatamente en el valor de las divisas.

Informes de organismos económicos y sociales. Los análisis de deudas con el FMI, los grandes préstamos de la UE o la salud de la industria de determinado país (sobre todo de las grandes potencias), así como los datos sobre el desempleo y la inflación, siempre ofrecen cierta visión esclarecedora de lo que pueda llegar a ocurrir en los mercados y en la economía. Por ello mismo, también tienen mucha importancia sobre las cotizaciones del Forex.


Conceptos básicos de los Mercados Financieros

51

4. CONCEPTOS BÁSICOS DE LOS MERCADOS FINANCIEROS “Estar preparado es importante, saber esperarlo es aún más, pero aprovechar el momento adecuado es la clave de la vida” - Arthur Schnitzler -

Como es bien sabido, el futuro no se puede predecir, pero existen medios para poder tener una aproximación muy acertada, basándose en el pasado y su posible repercusión en el futuro.

4.1. Análisis Técnico El análisis técnico se centra en el estudio del comportamiento del mercado en sí mismo, pues supone que toda la información relevante, en cuanto a los beneficios y expectativas de una determinada compañía está ya reflejada en el precio del título y, por tanto, es el propio mercado el que proporciona la mejor información sobre la evolución futura del mismo. Como se comentó en el capítulo introductorio, el efecto de la inclusión de conceptos basados en análisis técnico en sistemas de inversión es doble, ya que por un lado dichos análisis técnicos proporcionan una información útil acerca de la situación actual de los mercados y, por otro lado, numerosos inversores utilizan dicha información a la hora de tomar decisiones de compraventa, lo cual tiene un efecto de realimentación en los valores de mercado. La herramienta desarrollada en este proyecto propone, como veremos, el uso de indicadores técnicos, tanto para el análisis de las condiciones actuales de mercado, como para la generación en entradas a los modelos de predicción. En el ejemplo


práctico de uso de la herramienta, mostrado en la sección 7.1 veremos cómo, en efecto, algunos de los indicadores técnicos que se mostrarán a lo largo de este capítulo juegan un papel importante en calidad de regresares. De acuerdo con las premisas del análisis técnico el precio de mercado de un título viene determinado únicamente por la interacción de la oferta y la demanda, afectadas a su vez por factores tanto racionales como irracionales. El mercado no reflejaría el valor real de los títulos, sino lo que la gran masa de inversores piensa que valen los títulos y, por tanto, sería un reflejo de la psicología de los inversores. Se trataría, así pues, de observar la conducta de los individuos que integran el mercado y tratar de anticiparse a sus movimientos, es decir, a las futuras tendencias de los precios. Las tres premisas en las que se basa el análisis técnico son: 1.

Todo lo que puede afectar al precio de cualquier valor está totalmente descontado.

Dado que todo está descontado en el precio, el análisis del gráfico de este valor será todo lo que necesitemos. 2.

Los precios se mueven en tendencias.

El análisis técnico trata de identificar las posibles tendencias que comienzan a dibujarse y de operar a favor de ellas. Otro de los objetivos del análisis técnico es determinar el momento en el que la tendencia empieza a cambiar. 3.

La historia siempre se repite.

Casi todas las figuras chartistas vienen a mostrar el estado de ánimo o la psicología bajista o alcista de los inversores. Dado que el precio descuenta todo, también refleja los temores y miedos del mercado, las expectativas de los miles de inversores que lo forman. En consecuencia, si una figura ha funcionado bien en el pasado, se asume que funcionará bien en el futuro, siempre y cuando no haya habido un cambio sustancial en estos factores, que de otro modo se hubiera reflejado en el precio.


Conceptos básicos de los Mercados Financieros

53

4.1.1. Teoría de Dow Charles Dow y su socio Edward Jones fundaron Dow Jones & Company en 1882. La mayoría de los analistas de mercado coinciden en que gran parte de lo que hoy en día llamamos análisis técnico tiene sus orígenes en las teorías propuestas por primera vez por Dow. El 3 de julio de 1884 Dow publicó por primera vez una medida del mercado de valores o índice sectorial, compuesta por los precios de cierre de 11 valores: 9 empresas de ferrocarriles y dos empresas de fabricación. Dow pensaba que estos 11 valores proporcionaban una buena indicación acerca de la salud económica del país. En 1887 Dow determinó que dos índices separados representarían mejor esa salud, y creó un índice industrial de 12 valores (DJIA: Dow Jones Industrial Average) y un índice de ferrocarriles de 20 valores (DJTA: Dow Jones Transport Average). Hacia 1928, el índice industrial incluía ya 30 valores, número que se mantiene actualmente. Su índice, precursor de lo que hoy se considera el barómetro indicador de la actividad bursátil, sigue siendo una herramienta vital para los analistas técnicos. Dow describió todas sus ideas sobre el comportamiento bursátil en una serie de artículos editoriales publicados en The Wall Street Journal a comienzos del siglo XX. Dow aplicó su trabajo a las medias bursátiles que había creado, pero casi todas sus ideas analíticas se pueden aplicar igualmente bien a todas las medias del mercado. Los principios básicos que constituyen la Teoría de Dow son 6: 1. Las medias lo descuentan todo. 2. El mercado tiene tres tendencias. Dow definía una tendencia ascendente como una situación en la que cada sucesiva recuperación cierra más alto que el nivel alto de la recuperación previa, y cada sucesivo nivel bajo de la recuperación también cierra más alto que el nivel bajo de la recuperación previa. En otras palabras, una tendencia ascendente sigue un patrón de picos y valles cada vez más altos. La situación opuesta con picos y valles cada vez más bajos define una tendencia descendente. Dow consideraba que una tendencia tenía tres partes, primaria, secundaria y menor, que él comparaba con la marea, las olas y las ondas del mar. Dow consideraba las mareas del mercado con duración superior a un año (o más). La tendencia secundaria o intermedia representa correcciones en la tendencia primaria y suele durar de 3 semanas a 3 meses. Estas correcciones intermedias generalmente corrigen entre un tercio y dos tercios del movimiento anterior de la tendencia y con


mayor frecuencia alrededor de la mitad, o 50 por ciento, del movimiento anterior. La tendencia menor, o duración corta, suele durar menos de tres semanas y representa las fluctuaciones de la tendencia intermedia. 3. Las tendencias principales tienen tres fases. Dow concentró su atención en las tendencias primarias o principales, las que consideraba desarrollándose en tres fases claramente diferenciadas: una fase de acumulación, una fase de participación pública y una fase de distribución. 

Fase de acumulación. Compra de los inversores más astutos. En este momento de la tendencia, ya sea al alza o a la baja, estos inversores reconocen que el mercado ha acabado de asimilar todas las ‘’malas ‘’ y ‘’buenas’’ noticias.

Fase de participación pública. Empiezan a participar la mayoría de los que siguen tendencias. En estos momentos los precios empiezan a avanzar rápidamente.

Fase de distribución. Empieza cuando los periódicos publican noticias progresivamente alcistas, cuando las noticias económicas son mejores que nunca y cuando se incrementan el volumen especulativo y la participación pública. En esta última fase, los grandes inversores comienzan a ‘’distribuir”, antes de que nadie empiece a vender, todo lo que comenzaron a acumular”, cuando nadie quería comprar.

4. Las medias deben confirmarse entre ellas. Dow quería decir que no podía darse ninguna señal importante, a no ser que ambas medias dieran la misma señal, confirmándose así la una a la otra. No creía que las señales tuvieran que darse a la vez, pero sí que un intervalo más corto entre señales proporcionaba una mayor confirmación. Cuando ambas medias divergían, Dow asumía que todavía la tendencia no había comenzado. 5. El volumen debe confirmar la tendencia. El volumen es un factor importante a la hora de confirmar la tendencia. El volumen debería expandirse o incrementarse en la dirección de la tendencia principal. Dow consideraba que el volumen era un indicador secundario. El basaba sus verdaderas


Conceptos básicos de los Mercados Financieros

55

señales de compra y venta en los precios de cierre. 6. Se presume que una tendencia está en vigor hasta que da señales definitivas de que ha retrocedido. La tarea más difícil para un seguidor de la Teoría de Dow, o para cualquier seguidor de tendencia, es ser capaz de distinguir entre una corrección secundaria normal en una tendencia existente y el primer tramo de una nueva tendencia en la dirección opuesta.

4.1.2. Tipos de gráficos empleados Los gráficos muestran el valor de un determinado instrumento en un periodo específico de tiempo. El eje vertical representa el valor de los instrumentos mientras el eje horizontal muestra la escala temporal. Existen múltiple formas de representar dichos gráficos, a continuación se muestran los más utilizados.

4.1.2.1. Gráficos lineales Es un gráfico que se forma situando en el eje vertical las cotizaciones a precio de cierre de un valor o el índice de mercado y en el eje horizontal el periodo considerado. En ocasiones se utilizan escalas semi-logarítmicas.


Figura 4-1-Gráfico lineal. Fuente: Prorealtime

4.1.2.2. Gráficos de punto y figura Permiten representar la evolución de un valor sin tener en cuenta la escala de tiempo ya que sólo se mide la oferta y la demanda. Se elaboran situando en el eje vertical las cotizaciones del valor, y en el horizontal se van reflejando los cambios de tendencia manifestadas por las subidas y bajadas de los precios de los valores o índice de mercado analizado. Cuando se produce un movimiento significativo del precio, normalmente en torno a un tres por ciento como mínimo, se anota la siguiente información: •

una equis (X) cuando exista una subida de precio

un círculo (O) cuando exista una bajada de precio

Si los precios suben o bajan por una cantidad menor que la mínima requerida, los signos X y O no se dibujan. Las X y O se anotan en columnas, de manera que estas siempre se alternarán, creándose una nueva columna a la derecha de la anterior cuando ocurra un cambio


Conceptos básicos de los Mercados Financieros

57

de tendencia. Por ejemplo, si ha habido un período en el que han ocurrido tres subidas consecutivas, se anotará una columna de tres X. Si más tarde ocurre un cambio de tendencia en el que se producen cuatro bajadas seguidas, se añadirá una columna a la derecha formada por cuatro O. Por lo tanto, en el gráfico de punto y figura hay dos tipos de señales: si existe una columna de signos X consecutivos significa que el precio de ese valor en ese tramo ha estado subiendo. Y si, por el contrario, se observa una columna formada por una sucesión de signos O, significa que el precio de ese valor en ese tramo ha estado bajando.

Figura 4-2-Punto y figura. Fuente: Prorealtime

4.1.2.3. Gráficos de barras Estos gráficos se confeccionan teniendo en cuenta las cotizaciones más elevadas y más bajas que se producen en cada sesión bursátil. Dado que para cada sesión se traza una línea vertical que indica la cotización más alta y la más baja, el gráfico presenta la evolución del título a partir de una serie de barras. Este tipo de gráficos se suelen hacer para períodos semanales y además suelen ir acompañados de un gráfico de volumen de contratación.


Figura 4-3-Barras. Fuente: Prorealtime

4.1.2.4. Gráficos de velas En este tipo de gráficos los cambios de precios se representan con rectángulos a modo de cirios vacíos o llenos en cuyos extremos existen unos bastoncillos. La altura total del cirio corresponde a la distancia entre el precio más alto y más bajo del periodo considerado. El rectángulo o cirio se forma por la diferencia entre el precio de cierre y el de apertura de tal modo que, si el precio de cierre es superior al precio de apertura, éste es la base del rectángulo y el de cierre la altura del rectángulo, en este caso el rectángulo está vacío; en el caso contrario en que el precio de cierre es inferior al de apertura, el rectángulo estará lleno. Un rectángulo o cirio vacío indica una tendencia al alza y lleno una tendencia a la baja; cuanto más largo sea el cirio o rectángulo, indica más solidez en la tendencia. La sucesión de rectángulos o cirios llenos y vacíos anuncia también cambios en la tendencia. La información que aporta este tipo de gráficos es muy similar a la de los gráficos de barras, pero la ventaja es que aporta mayor claridad y permite una interpretación rápida y exacta de los datos.


Conceptos básicos de los Mercados Financieros

59

Figura 4-4-Velas. Fuente: Prorealtime

4.1.3. Herramientas de análisis gráfico Además del estudio de las tendencias primaria, secundaria y diaria, se han diseñado formaciones gráficas que se emplean para detectar nuevas tendencias en las cotizaciones bursátiles. A continuación se muestran algunas de estas herramientas, así como algunos ejemplos de formaciones que según [12] son característicos.

4.1.3.1. Tendencias El concepto de tendencia es muy importante en el análisis técnico ya que la mayoría de herramientas utilizadas en este tipo de análisis tienen como objetivo ayudar a detectar las tendencias del mercado. En un sentido amplio, la tendencia puede definirse como la dirección en la que se está moviendo el mercado. Pero para ser más precisos, debe decirse que el mercado presenta cambios de dirección similares a un zigzagueo y son las direcciones de los picos y valles los que indican la tendencia. Existen tres tipos de tendencias:


Tendencias alcistas: Sucesión de máximos y mínimos crecientes.

Tendencias bajistas: Sucesión de máximos y mínimos decrecientes.

Tendencias laterales: Cuando la sucesión de máximos y mínimos presenta un patrón horizontal.

4.1.3.2. Soportes y Resistencias Un soporte es un nivel de precios en el que se detiene la caída del valor y éste rebota nuevamente al alza. Si el mercado entendido, como la voluntad de millones de inversionistas, considera que es un nivel de precios muy bajo, cuando la cotización alcance ese valor, las compras se dispararán haciendo rebotar el precio al alza, como se muestra en la Figura 4-5.

Figura 4-5-Soporte Una resistencia es un nivel de precios en el que se detiene la subida del valor y éste rebota hacia abajo. Se muestra en la Figura 4-6

Figura 4-6-Resistencia

Regla de Oro: Cuando un soporte es cruzado a la baja se convierte en resistencia. Cuando una resistencia es cruzada al alza se convierte en soporte.


Conceptos básicos de los Mercados Financieros

61

4.1.3.3. Figuras técnicas Las figuras o patrones técnicos son dibujos que aparecen en las gráficas de cotizaciones, que pueden ser clasificados en diferentes categorías y que tienen un valor de predicción. En el estudio de tendencias, se establece que hay tres tipos: tendencias alcistas, tendencias bajistas y tendencias laterales. Es durante los periodos de tendencia lateral cuando aparecen la mayoría de los patrones. La mayoría de los cambios de tendencia en el precio se dan de una forma gradual. Estos periodos de transición sin embargo, pueden no ser señal de un cambio de tendencia, sino de una consolidación en el precio antes de seguir con la dirección previamente observada. Evidentemente, es indispensable que el analista técnico pueda diferenciar unas de otras tan pronto como sea posible durante su etapa de formación. Hay dos tipos de formaciones: las formaciones de cambio de tendencia y las formaciones de continuación. a)

Las formaciones de cambio de tendencia, son aquellas que indican que un cambio de dirección en la tendencia del precio está sucediendo. Algunos ejemplos son: 

Hombro-cabeza-hombro y hombro-cabeza-hombro invertido

Doble techo y doble suelo

Triples suelos y techos

Techo redondeado y suelo redondeado

b) Las formaciones de continuación, por el contrario, muestran que la tendencia del mercado va a continuar. Como por ejemplo: 

Triángulo ascendente y triángulo descendente

Triángulo simétrico

Bandera

Cuñas ascendentes y descendentes

El estudio de cada una de los patrones debe incluir:


Descripción del patrón: cómo se forma en la gráfica.

Factores críticos para su identificación: qué elementos debe incluir como mínimo para poder ser clasificado como tal.

Confirmación: Normalmente, la ruptura de un nivel de soporte o resistencia crítico confirma el patrón.

Validación a través del volumen: en momentos de duda, el comportamiento del volumen debe confirmar el patrón.

Precio objetivo medido: Representa la magnitud mínima esperada del movimiento posterior a la ruptura del patrón; ayuda al analista técnico a determinar la relación riesgo-rendimiento de la posible operación.

4.1.3.4. Retrocesos Los retrocesos son movimientos del precio en contra de la tendencia principal del precio. Se espera que la cotización retroceda una porción considerable del movimiento original, y encuentre soporte o resistencia en ciertos niveles previsibles antes de continuar su movimiento en la dirección anterior.

4.1.4. Ramas de estudio del análisis técnico El análisis técnico puede subdividirse en dos categorías: análisis gráfico (chartismo) y análisis cuantitativo.

4.1.4.1. Análisis gráfico o chartismo El análisis gráfico o chartista es se centra en la observación de la evolución de los mercados a partir de su representación gráfica. Los gráficos muestran, con todo detalle, la evolución o historia de cualquier valor cotizado, incluyendo los cambios de precios y el volumen de negociación. Dentro de este tipo de análisis se enmarca la teoría de ondas de Elliott basada en la reaparición sistemática de patrones en el mercado. Según Elliott, los mercados


Conceptos básicos de los Mercados Financieros

63

describen la tendencia principal en avances de cinco ondas y continúan con correcciones desplegadas en tres ondas en contra de esa tendencia principal.

4.1.4.2. Análisis cuantitativo El análisis cuantitativo trata de eliminar la subjetividad implícita en la interpretación del gráfico a través del empleo de matemática financiera y estadística. Por ello, los analistas técnicos disponen de una gama muy completa de herramientas, a menudo denominadas indicadores técnicos, que proporcionan información útil para el estudio del mercado. En función del tipo de información que ofrezcan, los indicadores pueden ser agrupados en las siguientes categorías: 

Indicadores de volatilidad Tal y como su nombre indica, estos indicadores muestra información relativa a los cambios en la volatilidad del mercado

Indicadores de tendencia Los indicadores de tendencia son usados para indicar la dirección del mercado, esto es, la dirección de la tendencia

Indicadores de momento Los indicadores de momento, o de ímpetu, miden la fuerza y/o velocidad de un movimiento direccional en el precio. La mayoría de los indicadores de momento muestran zonas de sobre-compra o sobre-venta.

Indicadores de volumen Los indicadores de volumen son utilizados para mostrar el volumen de comercio en una cotización en particular. Este tipo de indicadores son, por lo general, útiles a la hora de confirmar cambios de tendencia.

4.2. Principales indicadores en el análisis técnico cuantitativo El análisis cuantitativo trata de eliminar la subjetividad implícita en la interpretación del gráfico a través del empleo de matemática financiera y estadística. Por ello, los analistas técnicos disponen de una gama muy completa de


herramientas, a menudo denominadas indicadores técnicos, que proporcionan información útil para el estudio del mercado.

4.2.1. Indicadores de volatilidad En matemática financiera, la volatilidad es una medida de la frecuencia e intensidad de los cambios del precio de un activo o de un tipo definido como la desviación estándar de dicho cambio en un horizonte temporal específico. Se usa con frecuencia para cuantificar el riesgo del instrumento. La volatilidad es vista con frecuencia como negativa en tanto que representa incertidumbre y riesgo. Sin embargo, la volatilidad puede ser positiva en el sentido de que puede permitir obtener beneficio. La posibilidad de obtener beneficios mediante mercados volátiles es lo que permite a los agentes de mercado a corto plazo obtener sus ganancias, en contraste con la visión inversionista a largo término de comprar y mantener. A continuación se presentan dos de los indicadores técnicos más comunes a la hora de obtener información relativa a la volatilidad del precio de un activo.

4.2.1.1. Indicador ATR (Rango Verdadero Medio) ATR (Average True Range) es un indicador técnico desarrollado por J.W. Wilder. Average True Range proporciona una medida de la volatilidad del mercado. En primer lugar, se define el Rango Verdadero, TR, como la mayor de las siguientes medidas para un periodo dado: 

Diferencia entre el mayor máximo y el mayor mínimo.

Valor absoluto del máximo actual menos el último valor de cierre.

Valor absoluto del mínimo actual menos el último valor de cierre.

Finalmente se calcula el ATR como una media móvil del Rango Verdadero, normalmente de 14 periodos. ATR= [ATR (periodo anterior) * 13 + TR (rango verdadero de hoy)] / 14 La medida del ATR es útil debido a su sensibilidad a las fluctuaciones en el valor de un precio de mercado a lo largo de diferentes periodos, incluso cuando la diferencia entre el máximo y el mínimo de un periodo es muy pequeño (lo que


Conceptos básicos de los Mercados Financieros

65

podría indicar una falsa baja volatilidad).

4.2.1.2. Bandas de Bollinger Se trata de una técnica desarrollada por J. Bollinger. Se establecen dos bandas de fluctuación alrededor de una media móvil más dos desviaciones típicas por encima y por debajo de ésta, que generalmente es de 20 periodos. La desviación típica es una medida de la dispersión de los precios alrededor de un valor promedio. La representación gráfica de las bandas de Bollinger son dos curvas que envuelven el gráfico de precios. Se calcula a partir de una media móvil (simple o exponencial) sobre el precio de cierre a la que envuelven dos bandas que se obtienen de añadir y sustraer al valor de la media K desviaciones estándar (habitualmente, K = 2). La distancia entre las curvas superior e inferior, igual a cuatro desviaciones estándar, es por lo tanto una medida de la volatilidad del precio del activo. De acuerdo con el análisis técnico, el que los precios sobrepasen las bandas indica que el mercado está sobrecomprado (si lo hacen por arriba) o sobrevendido (si lo hacen por abajo).

Las Bandas de Bollinger usadas como metas La forma más sencilla de utilizar las bandas de Bollinger es usar las bandas superior e inferior como metas de los precios. En otras palabras, si los precios remontan a partir de la banda inferior y cruzan por encima la media de los 20 periodos, la banda superior pasa a ser el objetivo del precio más alto. Un cruce por debajo de la media de 20 periodos identificaría la banda inferior como el objetivo de la parte inferior. En una tendencia al alza fuerte, los precios suelen fluctuar entre la banda superior y la media de 20 periodos. En tal caso, un cruce por debajo de la media de 20 periodos podría avisar de un cambio de tendencia a la baja.

El ancho de la banda mide la volatilidad Las bandas de Bollinger se expanden y se contraen según la volatilidad de los últimos 20 periodos. Durante un periodo de volatilidad creciente en los precios, la distancia entre las dos bandas se ensanchará. Y a la inversa, durante un periodo de baja volatilidad del mercado, la distancia entre las dos bandas se contraerá. Hay una tendencia de las bandas a que se alternen entre expansión y contracción. Cuando las bandas están inusualmente separadas, es señal de que la tendencia actual puede estar cambiando, y cuando se han acercado mucho, es señal de que el


mercado puede estar iniciando una nueva tendencia.

Figura 4-7-Bollinger. Fuente: Prorealtime

4.2.2. Indicadores de tendencia 4.2.2.1. Media móvil (MA) El indicador técnico "Media Móvil" (Moving Average, MA) muestra el valor medio del precio de un instrumento durante un determinado período de tiempo. Cuando se calcula la media móvil, se promedia matemáticamente el precio del instrumento durante un período de tiempo dado. En función del cambio del precio, su valor medio va aumentando o disminuyendo. Hay varios tipos de medias móviles: simple (también se llama aritmética), exponencial, suavizada y ponderada. La media móvil puede ser calculada para cualquier conjunto secuencial de datos, incluyendo los precios de apertura y cierre, mínimos y máximos, volumen de trading o valores de otros indicadores. A menudo se utilizan las medias móviles de las mismas medias móviles. Lo único en que se diferencian sustancialmente las medias móviles de diferentes tipos son diferentes coeficientes ponderales que se asignan a los últimos datos. En


Conceptos básicos de los Mercados Financieros

67

caso de la Media Móvil Simple (Simple Moving Average), todos los precios del período considerado tienen el mismo peso. La Media Móvil Exponencial y la Pondera (Exponential Moving Average y Linear Weighted Moving Average) asignan más valor a los últimos precios. El modo más común de interpretar la media móvil del precio consiste en la comparación de su dinámica con la dinámica del mismo precio. Cuando el precio del instrumento financiero sube por encima del valor de la Media Móvil, aparece la señal de compra, cuando baja de la línea del indicador – salta la señal de venta. Tipos de medias móviles: 

Simple Moving Average (SMA) – Media Móvil Simple

Exponential Moving Average (EMA) – Media Móvil Exponencial

Smoothed Moving Average (SMMA) – Media Móvil Suavizada

Linear Weighted Moving Average (LWMA) – Media Móvil Ponderada Lineal

Figura 4-8-Media móvil. Fuente: Prorealtime


4.2.2.2. Indicador MACD El indicador técnico "Convergencia/Divergencia de Medias Móviles" (Moving Average Convergence/Divergence, MACD) es un indicador dinámico que sigue la tendencia. Muestra la correlación de dos medias móviles del precio. El indicador técnico MACD se construye como la diferencia de dos medias móviles exponenciales (EMA) con períodos de 12 y 26. Para definir con precisión los momentos oportunos de compra y venta, en el gráfico del MACD se dibuja una media móvil de 9 períodos, conocida como "línea de señal". El MACD es más eficaz cuando el mercado se oscila con una gran amplitud dentro de la horquilla de trading. Las señales más utilizadas del MACD son las siguientes: 

Cruzamiento: La principal regla de trading mediante el indicador MACD se basa en los cruces del indicador con su línea de señal: cuando el Moving Average Convergence/Divergence cae por debajo de la línea de señal, hay que vender, y si sube por encima, hay que comprar. Cuando el MACD cruza la línea cero arriba/abajo, esto también puede servir de señales de compra/venta, respectivamente.

Estado de sobrecompra/sobreventa: El Moving Average Convergence/Divergence es muy útil también como un indicador de sobrecompra/sobreventa. Cuando la media móvil corta sube sustancialmente por encima de la media móvil larga (es decir, el MACD va creciendo), eso significa que el precio del instrumento en cuestión seguramente está cotizado por encima de su valor real, y pronto volverá a un nivel más real.

Divergencia: Cuando entre el MACD y el precio se forma una divergencia, significa la posibilidad de pronta finalización de la tendencia actual. Una divergencia alcista surge cuando el MACD alcanza nuevos máximos, y el precio no logra alcanzarlo. Una divergencia bajista surge cuando el indicador alcanza nuevos mínimos, y el precio no lo consigue. Los ambos tipos de divergencia tienen más valor si se forman en las áreas de sobrecompra/sobreventa.


Conceptos básicos de los Mercados Financieros

69

Cálculo: el indicador técnico Moving Average Convergence/Divergence se determina restando la media móvil exponencial de 26 períodos de la media móvil exponencial de 12 períodos. Luego por encima del gráfico del MACD se puntea una media móvil simple de 9 períodos (la línea de señal).

4.2.2.3. SAR El indicador técnico "Sistema Parabólico SAR" (Parabolic SAR) ha sido desarrollado para analizar los mercados de tendencias. Este indicador se dibuja en el gráfico de precios. Por su sentido este indicador es muy similar a la media móvil, con la única diferencia que consiste en que el Parabolic SAR se mueve con más aceleración y puede cambiar su posición respecto al precio. En la tendencia alcista (Up Trend) el indicador se coloca por debajo de los precios, en la tendencia bajista (Down Trend) por encima. Si el precio cruza las líneas del Parabolic SAR, el indicador da la vuelta, y sus siguientes valores se sitúan por otro lado del precio. En caso de esta "vuelta" del indicador, por el punto de partida se tomará el precio máximo y el mínimo del período anterior. La vuelta del indicador indica en la finalización de la tendencia (traspaso a la corrección o flat), o en su vuelta. El Parabolic SAR detecta perfectamente los puntos de salida del mercado. Hay que cerrar las posiciones largas cuando el precio baja de la línea del indicador técnico, y las cortas cuando el precio sube por encima de la línea del Parabolic SAR. Es decir, es necesario monitorear la dirección del movimiento del Parabolic SAR y mantener en el mercado las posiciones abiertas sólo en la dirección de este movimiento. Muy a menudo este indicador se utiliza como la línea del trailing stop. Si la posición larga está abierta (es decir, el precio se encuentra por encima de la línea del Parabolic SAR), entonces la línea del indicador se desplaza hacia arriba independientemente de la dirección en el que se mueven los precios. El valor de desplazamiento de la línea del Parabolic SAR depende del valor del movimiento de precios.

4.2.3. Osciladores En análisis técnico, es la representación gráfica de una relación matemática entre variables bursátiles, en general las cotizaciones, que indica si el mercado se


encuentra en fase alcista o bajista y si, por lo tanto, es recomendable vender o comprar, según sea su tendencia, se produzca un cambio de sentido o según sea el corte de las líneas de referencia. Se mueve entre los valores del cero al cien por cien.

4.2.3.1. RSI (Índice de fuerza relativa) El indicador técnico "Índice de Fuerza Relativa" (Relative Strength Index, RSI) es el oscilador que sigue el precio y se oscila en el rango de 0 a 100. Cuando J. Wilder lo introdujo, recomendaba utilizar su variante de 14 períodos. Luego el RSI de 9 y 25 períodos también recibió una gran aceptación. Uno de los métodos más populares de análisis del indicador Relative Strength Index consiste en la búsqueda de divergencias cuando el precio forma un nuevo máximo y el RSI no consigue superar el nivel de su máximo anterior. La divergencia de este tipo indica en una posible vuelta de precios. Si luego el indicador da la vuelta hacia abajo y cae por debajo de su mínimo, entonces se dice que finaliza una "oscilación fallida" (failure swing). Esta oscilación fallida es considerada como confirmación de un pronto giro de precios. En el análisis de gráficos se consideran las siguientes señales del Relative Strength Index: 

Picos y valles

Los picos del indicador Relative Strength Index suelen formarse por encima de 70, y los valles por debajo 30, y generalmente anticipan la formación de picos y valles en el gráfico de precios. 

Modelos chartistas

El Relative Strength Index forma con frecuencia las siguientes formaciones chartistas: "cabeza y hombros" o triángulos, los cuales pueden mostrarse o no en el gráfico de precios. 

La oscilación fallida (ruptura del nivel de soporte y resistencia)

Tiene lugar cuando el Relative Strength Index sube sobre el máximo anterior (pico) o cae más bajo que el mínimo anterior (valle). 

Niveles de soporte y resistencia

En el gráfico del indicador Relative Strength Index los niveles de soporte y resistencia se ven incluso con más claridad que en el gráfico de precios.


Conceptos básicos de los Mercados Financieros

71

Divergencias

Como ya ha sido dicho antes, las divergencias se forman cuando el precio alcanza su nuevo máximo (mínimo), pero sin confirmarse con un nuevo máximo (mínimo) en el gráfico del RSI. En este caso generalmente sucede una corrección de precios en dirección del movimiento del indicador Relative Strength Index. La fórmula principal para calcular el Relative Strength Index es la siguente: RSI = 100 - (100 / (1 + U / D)) Aquí: U: valor medio de los cambios de precios positivos; D: valor medio de los cambios de precios negativos.

4.2.3.2. Momentum El indicador técnico "Momento" (Momentum) mide la variación del precio de un instrumento financiero en un determinado período de tiempo. Los principales modos de utilización del indicador son los siguientes: 

En calidad del oscilador que sigue la tendencia, igual que el Indicador técnico de Convergencia/Divergencia de Medias Móviles (Moving Average Convergence/Divergence, MACD). En este caso la señal de compra surge si el indicador Momentum forma un valle y empieza a crecer la señal de venta cuando alcanza el pico y se gira hacia abajo. Para una determinación más exacta de los momentos de giro del indicador, se puede utilizar su media móvil corta. Los valores extremamente altos o bajos del indicador suponen la continuación de la tendencia actual. Así, si el indicador alcanza los valores demasiado altos y luego se da la vuelta hacia abajo, es de esperar la futura subida de precios. Pero, en cualquier caso, no hace falta apresurarse abrir (o cerrar) posiciones hasta que los precios no confirmen la señal del indicador.

En calidad del indicador adelantado. Este método se basa en la suposición de que la fase final de una tendencia alcista suele acompañarse de una impetuosa subida de precios (porque todos creen en su continuación), y la


finalización del mercado bajista de su brusca caída (porque todos intentan salir del mercado). A menudo todo pasa precisamente de esta manera, sin embargo es una generalización demasiado amplia. El acercamiento del mercado al pico va acompañado de un salto brusco del indicador Momentum. Luego éste empieza a caer mientras que los precios siguen creciendo o continúan su movimiento horizontal. Por analogía, en el fondo del mercado el Momentum cae de forma brusca, y luego se da la vuelta hacia arriba mucho antes de que los precios empiecen a crecer. En ambos casos se forma una divergencia entre el indicador y los precios. El Momentum se determina como la relación entre el precio de hoy y el precio de hace n períodos: MOMENTUM = CLOSE (i) / CLOSE (i - n) * 100 Aquí: CLOSE (i) – precio de cierre de la barra actual; CLOSE (i - n) – precio de cierre de n barras antes.

4.2.4. Indicadores William Indicadores muy utilizados desarrollados por Larry Williams

4.2.4.1. Alligator La mayor parte de tiempo el mercado se queda inmóvil. Sólo unos 15-30% de todo el tiempo el mercado genera algunas tendencias, y los operadores que no se encuentran en la sala de la bolsa casi todos sus beneficios obtienen de los movimientos de tendencias. El indicador técnico Alligator es una combinación de las Líneas de Balance (Medias Móviles, Moving Averages) que utilizan la geometría fractal y la dinámica no lineal. La línea azul (Mandíbula del Alligator) es la Línea de Balance para el período de tiempo que se ha utilizado para la construcción del gráfico (media móvil suavizada de 13 períodos, desplazada al futuro a 8 barras);


Conceptos básicos de los Mercados Financieros

73

La línea roja (Dientes del Alligator) es la Línea de Balance para el período de tiempo significativo de un nivel más bajo (media móvil suavizada de 8 períodos, desplazada al futuro a 5 barras); La línea verde (Labios del Alligator) es la Línea de Balance para el período de tiempo significativo que está a un nivel más bajo (media móvil suavizada de 5 períodos, desplazada al futuro a 3 barras). Los Labios, Dientes y la Mandíbula del Alligator muestran la interacción de diferentes períodos de tiempo. Puesto que en el mercado se puede ver las tendencias sólo durante el 15-30 por ciento del tiempo, entonces hay que seguirlas y retenerse de operar en los mercados que se oscilan sólo en los márgenes de determinados períodos de precios. Cuando la Mandíbula, Dientes y Labios están cerrados o entrelazados, esto significa que el Alligator va a dormir o ya está durmiendo. Mientras está durmiendo, su hambre se aumenta. Cuanto más duerma, más hambre tendrá al despertarse. Lo primero que hace al despertarse es abrir su Boca y empezar a bostezar. Luego empieza a olfatear el olor de la comida: la carne del toro o la carne del oso, y se pone a cazarlos. Al saciar su hambre, el Alligator empieza a perder el interés por la comida precio (las Líneas del Balance se juntan) es la hora de fijar el beneficio. Se define matemáticamente de la siguiente manera: MEDIAN PRICE = (HIGH + LOW) / 2 ALLIGATORS JAW = SMMA (MEDIAN PRICE, 13, 8) ALLIGATORS TEETH = SMMA (MEDIAN PRICE, 8, 5) ALLIGATORS LIPS = SMMA (MEDIAN PRICE, 5, 3) Aquí: MEDIAN PRICE – precio mediano; HIGH – precio máximo de la barra; LOW – precio mínimo de la barra; SMMA (A, B, C) – media móvil suavizada. El parámetro А – datos suavizados, В – período de suavizado, С – desplazamiento al futuro. Por ejemplo, SMMA


(MEDIAN PRICE, 5, 3) significa que la media móvil suavizada se calcula del precio mediano, el período de suavizado es igual a 5 barras, y el desplazamiento es de 3; ALLIGATORS JAW – Mandíbula del Alligator (línea azul); ALLIGATORS TEETH – Dientes del Alligator (línea roja); ALLIGATORS LIPS – Labios del Alligator (línea verde).

4.2.4.2. Fractals Todos los mercados se caracterizan por el hecho de que durante la mayor parte de tiempo los precios no se cambian mucho, y sólo durante un período bastante corto (15-30 por ciento) muestran los cambios de tendencia. Los períodos más favorables para sacar beneficios son aquéllos cuando los precios en los mercados se cambian según una determinada tendencia. Los fractales (Fractals) son uno de los cinco indicadores del sistema de trading de Bill Williams que permite detectar los máximos y/o mínimos. La definición técnica de un fractal hacia arriba es una serie de al menos cinco barras consecutivas con el mayor máximo en el medio y dos máximos menores a cada uno de sus lados. La configuración opuesta corresponde al fractal hacia abajo (una serie de cinco barras con el menor mínimo en el medio y dos barras con los mínimos más altos a cada uno de sus lados). En el gráfico los fractales tienen los valores de High y Low, y están marcados con flechas hacia arriba o abajo, respectivamente. Es necesario filtrar las señales del indicador técnico Fractals, usando el indicador técnico Alligator. En otras palabras, no se debe realizar una operación de compra si el fractal se encuentra por debajo de los Dientes del Alligator, y tampoco se debe realizar una operación de venta si el fractal se encuentra por encima de los Dientes del Alligator. Después de que la señal del fractal haya sido formada y tenga validez, lo cual se determina por su posición fuera de la Boca del Alligator, ésta se mantiene como señal mientras no se consuma, o hasta que surja una señal más reciente del fractal.

4.2.5. Indicadores de volumen Los indicadores de volúmenes son aquéllos en cuyos cálculos se utilizan los volúmenes de transacciones, los llamados tics.


Conceptos básicos de los Mercados Financieros

75

4.2.5.1. Balance de volúmenes (OBV) El indicador OBV (On Balance Volume) se utiliza para determinar el flujo del volumen negociado (Volume) de una acción. La hipótesis en la que se basa el indicador es que los movimientos en el volumen negociado pueden preceder a los movimientos del precio. Este indicador fue introducido por Joe Granville en 1963. OBV se calcula añadiendo el volumen de un periodo al volumen acumulado total cuando la acción cierra a un precio mayor al último cierre, y restando el volumen del periodo al volumen acumulado cuando la acción cierra a un precio menor que el último cierre. Analíticamente, OBV es un indicador cuyo valor a lo largo del tiempo depende de las variaciones del precio y del volumen negociado. Una de sus interpretaciones es que cuando el volumen negociado cae o sube dramáticamente sin que en el precio de la acción se produzcan cambios importantes, el precio de la acción presentará una cierta propensión a descender o subir. Un aumento en el volumen negociado implica el interés de muchos inversores en la compra del activo y probablemente, su encarecimiento debido al aumento de la demanda. Por el contrario, un descenso en el volumen negociado (escaso interés inversionista en el activo) el precio tenderá a caer debido a la escasa demanda.

4.2.5.2. Accumulation/Distribution El indicador técnico "Acumulación/Distribución" (Accumulation Distribution, A/D) es determinado por el cambio del precio y volumen. El volumen actúa como un coeficiente ponderal durante el cambio del precio: cuanto más alto sea el coeficiente (volumen), más aportación hace el cambio del precio (durante este intervalo de tiempo) en el volumen del indicador. Prácticamente, este indicador es una versión del indicador "Balance de Volúmenes" (On Balance Volume) que se utiliza con más frecuencia. Los dos se utilizan para confirmar los cambios de precios a través de la medición del volumen de ventas correspondiente. El crecimiento del indicador Accumulation/Distribution (A/D) significa la acumulación (compra) de los títulos, dado que la mayor parte del volumen de trading está relacionada con la tendencia de precios alcista. Cuando el indicador cae, significa la distribución (venta) de los títulos, ya que la mayor parte del volumen de trading está relacionada con la tendencia de precios a la baja.


Las divergencias entre el indicador Accumulation/Distribution y el precio del título indican en el próximo cambio de precios. Normalmente, en caso de la divergencia la tendencia de precios suele cambiarse en la dirección del movimiento del indicador. Así que si el indicador crece y el precio del título baja, habrá que esperar el giro de los precios.


77

Redes Neuronales

5. REDES NEURONALES ¿Existen las meigas? No, pero haberlas "haylas" - Dicho gallego -

Es este capítulo se presentan y explican los principales tipos de RNA, haciendo mayor hincapié en las utilizadas en el algoritmo propuesto. Se definen arquitectura, diseño, algoritmos de retropropagación y los diferentes tipos de entrenamientos.

5.1. Conceptos básicos Las redes neuronales artificiales son una forma de emular el aprendizaje y procesamiento automático inspirado en el modo en que funciona el cerebro humano, es decir, un complejo sistema de interconexión de neuronas formando una red capaz de producir estímulos de salida (transmite información como salida). Una red neuronal se compone de unidades llamadas neuronas. El objetivo es simular las propiedades observadas del sistema neurológico e implementarlas en mecanismos artificiales, mediante modelos matemáticos. De este modo, se consigue que las máquinas den respuestas similares a las que puede dar el cerebro, que principalmente son la generalización y la robustez ante variaciones en las entradas. El primer modelo de red neuronal fue propuesto en 1943 por McCulloch y Pitts en términos de un modelo computacional de actividad nerviosa. Este modelo era un modelo binario, donde cada neurona tenía un escalón o umbral prefijado, y sirvió de base para los modelos posteriores. Entrando en detalle sobre las ventajas de este tipo de técnicas, podemos citar: 

Aprendizaje Adaptativo: capacidad de aprender a realizar tareas basadas


en un entrenamiento o en una experiencia inicial. 

Auto-organización: una red neuronal puede crear su propia organización o representación de la información que recibe mediante una etapa de aprendizaje.

Tolerancia a fallos: la destrucción parcial de una red conduce a una degradación de su estructura, sin embargo, algunas capacidades de la red se pueden retener, incluso sufriendo un gran daño.

Operación en tiempo real: los cómputos neuronales pueden ser realizados en paralelo. Para esto se diseñan y fabrican máquinas con hardware especial para obtener esta capacidad.

Fácil inserción dentro de la tecnología existente: se pueden obtener chips especializados para redes neuronales que mejoran su capacidad en ciertas tareas. Ello facilitará la integración modular en los sistemas existentes.

El elemento básico de computación (modelo de neurona) se le llama habitualmente nodo o unidad. Recibe un input desde otras unidades o de una fuente externa de datos. Cada input tiene un peso asociado (w), que se va modificando en el llamado proceso de aprendizaje. Cada unidad aplica una función dada de la suma de los inputs ponderada mediante los pesos. El resultado puede servir como output de otras unidades. Así que se necesitan parejas de patrones de entrenamiento, las de entrada y las de respuesta deseada. Las características de las redes neuronales juegan un importante papel, por ejemplo, en el procesado de señales e imágenes. Se usan arquitecturas que comprenden elementos de procesado adaptativo paralelo, combinados con estructuras de interconexiones jerárquicas. Hay dos fases en la modelización con redes neuronales: 

Fase de entrenamiento: se usa un conjunto de datos o patrones de entrenamiento para determinar los pesos (parámetros) que definen el modelo de red neuronal. Se calculan de manera iterativa, de acuerdo con los valores de los valores de entrenamiento, con el objeto de minimizar el error cometido entre la salida obtenida por la red neuronal y la salida deseada.

Fase de prueba: en la fase anterior, el modelo puede que se ajuste


Redes Neuronales

79

demasiado a las particularidades presentes en los patrones de entrenamiento, perdiendo su habilidad de generalizar su aprendizaje a casos nuevos (sobreajuste). Para evitar el problema del sobreajuste, es aconsejable utilizar un segundo grupo de datos diferentes a los de entrenamiento, el grupo de validación, que permita controlar el proceso de aprendizaje. Normalmente, los pesos óptimos se obtienen optimizando (minimizando) alguna función de energía. Por ejemplo, un criterio muy utilizado es el llamado entrenamiento supervisado, el cual consiste en minimizar el error cuadrático medio entre el valor de salida y el valor real esperado. Una vez seleccionado el modelo de red cuya configuración de parámetros ha obtenido la mejor ejecución ante el conjunto de validación, debemos evaluar la capacidad de generalización de la red de una forma completamente objetiva a partir de un tercer grupo de datos independiente, el conjunto de test.

5.2. Perceptrón multicapa El perceptrón multicapa o red multicapa con conexiones hacia adelante es una clase de redes de neuronas. El perceptrón multicapa es una generalización del perceptrón simple y surgió como consecuencia de las limitaciones de dicha arquitectura en lo referente al problema de la separabilidad no lineal. En 1969 Minsky y Papert mostraron que la combinación de varios perceptrones simples (inclusión de neuronas ocultas) podía resultar una solución adecuada para tratar problemas no lineales. Diferentes autores han demostrado de manera independiente que el perceptrón multicapa es un aproximador universal, en el sentido de que cualquier función continua puede aproximarse con un Perceptrón Multicapa, con al menos una capa de neuronas ocultas. Este resultado sitúa al perceptrón multicapa como un modelo matemático útil a la hora de aproximar o interpolar relaciones no lineales entre datos de entrada y salida. Dentro del marco de las redes de neuronas, el perceptrón multicapa es en la actualidad una de las arquitecturas más utilizadas en la resolución de problemas. Esto es debido, fundamentalmente, a su capacidad como aproximador universal,


así como a su fácil uso y aplicabilidad. Por otra parte, el Perceptrón multicapa posee una serie de limitaciones, como el largo proceso de aprendizaje para problemas complejos dependientes de un gran número de variables, la dificultad para realizar un análisis teórico de la red debido a la presencia de componentes no lineales y a la alta conectividad. Es necesario señalar que el proceso de aprendizaje de la red busca en un espacio amplio de funciones, una posible función que relacione las variables de entrada y salida al problema, lo cual puede complicar su aprendizaje y reducir su efectividad en determinadas aplicaciones.

5.2.1. Arquitectura La arquitectura de perceptrón multicapa se caracteriza porque tiene sus neuronas agrupadas en capas de diferentes niveles. Cada una de las capas está formada por un conjunto de neuronas y se distinguen tres tipos de capas diferentes: la capa de entrada, las capas ocultas y la capa de salida. Las neuronas de la capa de entrada no actúan como neuronas propiamente dichas, sino que se encargan únicamente de recibir las señales o patrones del exterior y propagar dichas señales a todas las neuronas de la siguiente capa. La última capa actúa como salida de la red, proporcionando al exterior la respuesta de la red para cada uno de los patrones de entrada. Las neuronas de las capas ocultas realizan un procesamiento no lineal de los patrones recibidos.

Figura 5-1-Arquitectura Red


Redes Neuronales

81

Como se observa en la Figura 5-1, las conexiones del perceptrón multicapa siempre están dirigidas hacia adelante, es decir, las neuronas de una capa se conectan con las neuronas de la siguiente capa, de ahí que reciban también el nombre de redes alimentadas hacia adelante o redes feedforward. Las conexiones entre las neuronas de la red llevan también asociado un umbral, que el caso del perceptrón multicapa suele tratarse como una conexión más a la neurona, cuya entrada es constante e igual a 1. Generalmente, todas las neuronas de una capa están conectadas a todas las neuronas de la siguiente capa. Se dice entonces que existe conectividad total o que la red está totalmente conectada. Aunque en la mayor parte de los casos la arquitectura del perceptrón multicapa está asociada al esquema de la Figura 5-1-Arquitectura Red , también es posible englobar dentro de este tipo de redes a arquitecturas con las siguientes características: 

Redes con conexiones de todas o ciertas neuronas de una determinada capa a neuronas de capas posteriores, aunque no inmediatamente posteriores.

Redes en las que ciertas neuronas de ciertas capas no están conectadas a neuronas de la siguiente capa, es decir, el peso es constante e igual a cero.

Cuando se aborda un problema con el perceptrón multicapa, en la mayoría de los casos se parte de una arquitectura totalmente conectada, es decir, todas las neuronas de una capa están conectadas a todas las neuronas de la siguiente capa. No es posible demostrar que si se utilizan arquitecturas en las que se eliminan o se añaden conexiones de una capa a capas no inmediatamente posteriores, se puedan obtener mejores resultados. Sin embargo, en ocasiones, y debido fundamentalmente a la naturaleza del problema, se pueden encontrar redes multicapa con estas características en sus conexiones.

5.2.2. Propagación de los patrones de entrada El perceptrón multicapa define una relación entre las variables de entrada y las variables de salida de la red. Esta relación se obtiene propagando hacia adelante los


valores de las variables de entrada. Para ello, cada neurona de la red procesa la información recibida por sus entradas y produce una respuesta o activación que se propaga, a través de las conexiones correspondientes, hacia las neuronas de la siguiente capa. Se mostrara a continuación las expresiones para calcular las activaciones de las neuronas de la red. Sea un perceptrón multicapa con C capas, C-2 capas ocultas, y 𝑛𝑐 neuronas en la capa c, para c=1,2,…, C. Sea 𝑊 𝑐 = (𝑤𝑖𝑗𝑐 ) la matriz de pesos donde 𝑤𝑖𝑗𝑐 representa el peso de la conexión de la neurona i de la capa c para c=1,2,…, C. Estas activaciones se calculan del siguiente modo: 

Activación de las neuronas de la capa de entrada (𝑎1𝑖 ). Las neuronas de la capa de entrada se encargan de transmitir hacia la red las señales recibidas desde el exterior. Por tanto: 𝑎1𝑖 =𝑥𝑖 𝑝𝑎𝑟𝑎 𝑖=1,2,…𝑛1

(5.1)

Donde 𝑋 = (𝑥1 , 𝑥2 , … , 𝑥𝑛1 ) representa el vector o patrón de entrada a la red. 

Activación de las neuronas de la capa oculta c (𝑎𝑖𝑐 ). Las neuronas ocultas de la red procesan la información recibida aplicando la función de activación f a la suma de los productos de las activaciones que recibe por sus correspondientes pesos, es decir:

𝑛

𝑐−1 𝑎𝑖𝑐 = 𝑓(∑𝑗=1 𝑤𝑗𝑖𝑐−1 𝑎𝑗𝑐−1 + 𝑢𝑖𝑐 ) 𝑝𝑎𝑟𝑎 𝑖 = 1, 2, … , 𝑛𝑐 𝑦 𝑐 = 2,3, … , 𝐶 − 1 (5.2)

Donde 𝑎𝑖𝑐−1 son las activaciones de las neuronas de la capa c-1. 

Activaciones de las neuronas de la capa de salida ). Al igual que en el caso anterior, la activación de estas neuronas viene dada por la función de activación aplicada a la suma de los productos de las entradas que recibe por sus correspondientes pesos:

𝑦𝑖=𝑎𝑐=𝑓(∑𝑛𝑐−1 𝑤𝑐−1 𝑎𝑐−1 +𝑢𝑐 ) 𝑝𝑎𝑟𝑎 𝑖=1,2,…,𝑛𝑐 𝑖

𝑗=1

𝑗𝑖

𝑗

𝑖

(5.3)


83

Redes Neuronales

Donde Y= (𝑦1 , 𝑦2 , … , 𝑦𝑛𝑐 ) es el vector de salida de la red. La función f es la llamada función de activación. Para el perceptrón multicapa, las funciones de activación más utilizadas son la función sigmoidal y la función tangente hiperbólica.

Figura 5-2-Funciones activación Dichas funciones poseen como imagen un intervalo continuo de valores dentro de los intervalos [0 1] y [-1 1], respectivamente, y vienen dadas por las siguientes ecuaciones: 

Función sigmoidal: 𝑓𝑠𝑖𝑔𝑚 (𝑥) =

1 1 + 𝑒 −𝑥

Función tangente hiperbólica: 1−𝑒 −𝑥

𝑓𝑡ℎ𝑖𝑝 (𝑥) = 1+𝑒 −𝑥

Ambas son funciones crecientes con dos niveles de saturación: el máximo, que proporciona salida 1, y el mínimo, salida 0 para la función sigmoidal y salida -1, para la tangente hiperbólica. En algunas ocasiones, la función de activación en el perceptrón multicapa es común a todas las neuronas de la red y es elegida por el diseñador, elección que se realiza únicamente basándose en los valores de activación que se desee que alcancen las


neuronas. Ambas funciones están relacionadas mediante la expresión: 𝑓𝑠𝑖𝑔𝑚 (𝑥) = 2𝑓𝑡ℎ𝑖𝑝 (𝑥) − 1

(5.4)

Por lo que la utilización de una u otra se elige únicamente en función del recorrido que interese. En otras ocasiones, y dependiendo de la naturaleza del problema, las neuronas de salida se distinguen del resto de neuronas de la red, utilizando otro tipo de función de activación. En este caso, las más usadas son la función identidad y la función escalón. De las ecuaciones (5.2), (5.3) y (5.4), se observa que el perceptrón multicapa define, a través de sus conexiones y neuronas, una función continua no lineal del espacio 𝑅𝑛1 , espacio de los patrones de entrada, al espacio 𝑅𝑛𝑐 , espacio de los patrones de salida. Se puede escribir, por tanto, que:

𝑌 = 𝐹(𝑋, 𝑊)

(5.5)

Donde Y es el vector formado por las salidas de la red, X es el vector de entrada a la red, W es el conjunto de todos los parámetro de la red, pesos y umbrales, y F es una función continua no lineal dada por las ecuaciones (5.2), (5.3) y (5.4).

5.2.3. Consideraciones de diseño Cuando se aborda un problema utilizando el Perceptrón Multicapa, uno de los primeros pasos a realizar es el diseño de la arquitectura de la red. Este diseño implica la determinación de la función de activación a emplear, el número de neuronas y el número de capas de la red. Como se ha comentado anteriormente, la elección de la función de activación se suele hacer basándose en el recorrido deseado, y el hecho de elegir una u otra, generalmente, no influye en la capacidad de la red para resolver el problema. En lo que respecta al número de neuronas y capas, algunos de estos parámetros vienen dados por el problema y otros deben ser elegidos por el diseñador. Así, por ejemplo, tanto el número de neuronas en la capa de entrada, como el número de


Redes Neuronales

85

neuronas en la capa de salida, vienen dados por las variables que definen el problema. En algunas aplicaciones prácticas, no hay lugar a duda sobre el número de entradas y salidas. Sin embargo, existen problemas los que el número de variables de entrada relevantes para el problema no se conoce con exactitud. En estos casos, se disponen de un gran número de variables, algunas de las cuales podrán no aportar información relevante a la red, y su utilización podrá complicar el aprendizaje, pues implicar a arquitecturas de gran tamaño y con alta conectividad. En estas situaciones, es conveniente realizar un análisis previo de las variables de entrada más relevantes al problema y descartar aquellas que no aportan información a la red. Este análisis puede llegar a ser una tarea complicada y requerir técnicas avanzadas, como técnicas basadas en análisis de correlación, análisis de componentes principales, análisis de importancia relativa, análisis de sensibilidad o técnicas basadas en algoritmos genéticos, entre otras. El número de capas ocultas y el número de neuronas en estas capas deben ser elegidos por el diseñador. No existe un método o regla que determine el número óptimo de neuronas ocultas para resolver un problema dado. En la mayor parte de las aplicaciones prácticas, estos parámetros se determinan por prueba y error. Partiendo de una arquitectura ya entrenada, se realizan cambios aumentando o disminuyendo el número de neuronas ocultas y el número de capas hasta conseguir una arquitectura adecuada para el problema a resolver, que pudiera no ser la óptima, pero que proporciona una solución. Si bien el número de neuronas ocultas puede incluir en el comportamiento de la red, como se verá más adelante, capacidad de generalización de la red, es necesario indicar que en el caso del Perceptrón multicapa, generalmente, el número de neuronas ocultas no es parámetro significativo, pues dado un problema, pueden existir una gran cantidad de arquitecturas capaces de resolver de manera adecuada dicho problema. Además, añadir o eliminar una neurona oculta no incluye, de manera significativa, en la capacidad predictiva de la red. En la actualidad existen líneas de investigación abiertas centradas en la determinación automática del número de neuronas ocultas, así como de capas ocultas, para cada problema en particular. En el caso del Perceptrón multicapa, la mayor parte de estos trabajos se basan en la utilización de técnicas evolutivas, las cuales realizan una búsqueda en el espacio de las arquitecturas de redes guiada por la optimización del rendimiento de la red.


5.2.4. Algoritmo de Retropropagación La regla o algoritmo de aprendizaje es el mecanismo mediante el cual se van adaptando y modificando todos los parámetros de la red. En el caso del perceptrón multicapa se trata de un algoritmo de aprendizaje supervisado, es decir, la modificación de los parámetros se realiza para que la salida de la red sea lo más próxima posible a la salida proporcionada por el supervisor o salida deseada. Por tanto, para cada patrón de entrada a la red es necesario disponer de un patrón de salida deseada. Puesto que el objetivo es que la salida de la red sea lo más próxima posible a la salida deseada, el aprendizaje de la red se formula como un problema de minimización del siguiente modo: 𝑀𝑖𝑛 𝑊𝐸

(5.6)

Siendo W el conjunto de parámetros de la red, pesos y umbrales y E una función error que evalúa la diferencia entre las salidas de la red y las salidas deseadas. En la mayor parte de los casos, la función error se define como:

1

𝐸 = ∑𝑁 𝑛=1 𝑒(𝑛) 𝑁

(5.7)

Donde N es el número de patrones o muestras y 𝑒(𝑛) es el error cometido por la red para el patrón n, dado por:

𝑒(𝑛) =

1 𝑛𝑐

2 ∑𝑛𝑐 𝑖=1(𝑠𝑖 (𝑛) − 𝑦𝑖 (𝑛))

(5.8)

Siendo 𝑌(𝑛) = (𝑦1 (𝑛), … , 𝑦𝑛𝑐 (𝑛)) y 𝑆(𝑛) = (𝑠1 (𝑛), … , 𝑠𝑛𝑐 (𝑛)) los vectores de salidas de la red y salidas deseadas para el patrón 𝑛, respectivamente. De este modo, si 𝑊 ∗ es un mínimo de la función error E, en dicho punto el error es próximo a cero, lo cual implica que la salida de la red es próxima a la salida deseada, alcanzando así la meta de la regla de aprendizaje.


87

Redes Neuronales

Por tanto, el aprendizaje del perceptrón multicapa es equivalente a encontrar un mínimo de la función error. La presencia de funciones de activación no lineales hace que la respuesta de la red sea no lineal respecto a los parámetros ajustables, por lo que el problema de minimización es un problema no lineal, y, como consecuencia, tienen que utilizarse técnicas de optimización no lineales para su resolución. Dichas técnicas están, generalmente, basadas en una adaptación de los parámetros siguiendo una cierta dirección de búsqueda. En el contexto de redes de neuronas, y en particular para el perceptrón multicapa, la dirección de búsqueda más comúnmente usada es la dirección negativa del gradiente de la función E, método de descenso del gradiente, pues conforme al cálculo de varias variables, ésta es la dirección en la que la función decrece. Aunque, estrictamente hablando, el aprendizaje de la red debe realizarse para minimizar el error total, el procedimiento más utilizado está basado en métodos del gradiente estocástico, los cuales consisten en una sucesiva minimización de los errores para cada patrón, 𝑒(𝑛) en lugar de minimizar el error total E. Por tanto, aplicando el método de descenso del gradiente estocástico, cada parámetro 𝑤 de la red se modifica para cada patrón de entrada 𝑛 de acuerdo con la siguiente ley de aprendizaje.

𝑤(𝑛) = 𝑤(𝑛 − 1) − 𝛼

𝜕𝑒(𝑛) 𝜕𝑤

(5.9)

Donde 𝑒(𝑛), es el erro para el patrón 𝑛 dado por la Ecuación 5.9, y 𝛼 es la razón o tasa de aprendizaje, parámetro que influye en la magnitud del desplazamiento en la superficie del error, como se analizará más adelante. Debido a que las neuronas de la red están agrupadas en capas de distintos niveles, es posible aplicar el método del gradiente de forma eficiente, resultando el conocido Algoritmo de Retropropagación o Regla Delta Generalizada. El término de Retropropagación se utiliza debido a la forma de implementar el método del gradiente del perceptrón multicapa, pues el error cometido en la salida de la red es propagado hacia atrás, transformándolo en un error para cada una de las neuronas ocultas de la red.


5.2.4.1. Regla delta generalizada La regla delta propuesta por Widrow en 1960 ha sido extendida a redes con capas intermedias con conexiones hacia adelante (feedforward) y cuyas células tiene funciones de activación continuas (lineales o sigmoidales), dando lugar al algoritmo Backpropagation (Retropropagación). Estas funciones continuas son no decrecientes y derivables, a diferencia de la función escalón que se utiliza en el perceptrón, que no es derivable en el punto de discontinuidad. Este algoritmo utiliza también una función o superficie de error asociada a la red, buscando el estado estable de mínima energía o de mínimo error a través del camino descendente de la superficie del error. Por ello, realimenta el error del sistema para realizar la modificación de los pesos en un valor proporcional al gradiente decreciente de dicha función de error. El error es la diferencia cuadrática media entre las salidas de la red con los pesos actuales y las salidas deseadas. El método que sigue la regla delta generalizada para ajustar los pesos es actualizarlos de forma proporcional a la delta o diferencia entre la salida deseada y la obtenida:

𝛿 = 𝑠𝑎𝑙𝑖𝑑𝑎 𝑑𝑒𝑠𝑒𝑎𝑑𝑎 − 𝑠𝑎𝑙𝑖𝑑𝑎 𝑜𝑏𝑡𝑒𝑛𝑖𝑑𝑎

(5.10)

Dada una neurona Ui y la salida 𝑦𝑖 que produce el cambio que se produce en el peso de la conexión que une la salida de dicha neurona con la unidad 𝑈𝑗 (𝑤𝑗𝑖 ) para un patrón de aprendizaje 𝑝 determinado es:

∆𝑤𝑖𝑗 (𝑡 + 1) = 𝛼𝛿𝑝𝑗 𝑦𝑝𝑖

(5.11)

El punto en el que difieren la regla delta generalizada de la regla delta es en el valor concreto 𝑑𝑝𝑗 . Por otro lado, en las redes multicapas a diferencia de las redes sin neuronas ocultas, en principio no se puede conocer la salida deseada de las neuronas de las capas ocultas para poder determinar los pesos en función del error cometido. Sin embargo inicialmente si podemos conocer la salida deseada de las


89

Redes Neuronales

neuronas de salida. Según esto, si consideramos la unidad 𝑈𝑗 de salida, entonces definimos:

𝛿𝑝𝑗 = (𝑑𝑝𝑗 − 𝑦𝑝𝑗 )𝑓(𝑠𝑢𝑚𝑗 )

(5.12)

Donde 𝑑𝑝𝑗 es la salida deseada de la neurona j para el patrón p y 𝑠𝑢𝑚𝑗 es la entrada neta que recibe la neurona j. Esta fórmula es como la de la regla delta, excepto en lo que se refiere a la derivada de la función de transferencia. Este término representa la modificación que hay que realizar en la entrada que recibe la neurona j en el caso en que dicha neurona no sea de salida, el error que se produce estará en función del error que se cometa en las neuronas que reciban como entrada la salida de dicha neurona. Esto es lo que se denomina el procedimiento de propagación del error hacia atrás.

Figura 5-3-Esquema-capas

Según esto, en el caso de que Uj no sea una neurona de salida, el error que se produce esta en función del error que se comete en las neuronas que reciben como entrada la salida de Uj.

𝛿𝑝𝑗 = (∑𝑘 𝛿𝑝𝑘 𝑊𝑘𝑗 )𝑓′(𝑠𝑢𝑚𝑗 )

(5.13)


Donde el rango k cubre todas aquellas neuronas a las que la red está conectada con la salida de Uj. De esta forma, el error que se produce en una neurona oculta es la suma de los errores que se producen en las neuronas a las que está conectada la salida de ésta, multiplicando cada uno de ellos por el peso de la conexión. Adición de un momento a la regla delta generalizada El método de propagación de error, también conocido como del gradiente descendiente, requiere un importante número de cálculos para lograr el ajuste de los pesos en la red. En la implementación del algoritmo, se toma una amplitud de paso que viene dada por la tasa de aprendizaje. A mayor tasa de aprendizaje, mayor es la modificación de los pesos en cada iteración, con lo que el aprendizaje será más rápido, por otra parte, puede dar lugar a oscilaciones. Para filtrar estas oscilaciones se añade en la expresión del incremento de los pesos (ecuación 5-13) un término (momento) β, de manera que dicha expresión quede:

𝑊𝑗𝑖 (𝑡 + 1) = 𝑊𝑗𝑖 (𝑡) + 𝛼𝛿𝑝𝑗 𝑦𝑝𝑖 + 𝛽(𝑊𝑗𝑖 (𝑡) − 𝑊𝑗𝑖 (𝑡 − 1))

∆𝑊𝑗𝑖 (𝑡 + 1) = 𝛼𝛿𝑝𝑗 𝑦𝑝𝑖 + 𝛽∆𝑊𝑗𝑖 (𝑡)

(5.14)

(5.15)

Donde 𝛽 es una constante (momento) que determina el efecto en t+1 del cambio de pesos en el instante t. Con este momento se logra la convergencia de la red en menor número de iteraciones, ya que si en t el incremento de un peso era positivo y en t+1 también, entonces el descenso por la superficie del error en t+1 es mayor. Sin embargo, si en t el incremento era positivo y en t+1 es negativo, el paso que se da en t+1 es más pequeño, lo cual es adecuado, ya que esto significa que ha pasado por un mínimo y que los pasos deben ser menores para poder alcanzarlo. Resumiendo, el algoritmo queda como sigue:

𝑊𝑗𝑖 (𝑡 + 1) = 𝑊𝑗𝑖 (𝑡) + ∆𝑊𝑗𝑖 (𝑡 + 1)

(5.16)


91

Redes Neuronales

𝑊𝑗𝑖 (𝑡 + 1) = 𝑊𝑗𝑖 (𝑡) + (𝛼𝛿𝑝𝑗 + 𝛽∆𝑊𝑗𝑖 (𝑡))

(5.17)

Donde: 𝛿𝑝𝑗 = (𝑑𝑝𝑗 − 𝑦𝑝𝑗 )𝑓′(𝑠𝑢𝑚𝑗 )

(5.18)

Si Uj es una neurona de salida, y 𝛿𝑝𝑗 = (∑ 𝛿𝑝𝑘

𝑊𝑘𝑗 )𝑓′(𝑠𝑢𝑚𝑗 )

(5.19)

Si Uj no es una neurona de salida.

5.2.4.2. Razón de aprendizaje El cambio en un peso de la red es proporcional al gradiente del error como se refleja en la ecuación (5.20). Dicha proporcionalidad viene dada por el parámetro 𝛼, también llamado razón o tasa de aprendizaje. Este parámetro es el encargado de controlar cuánto se desplazan los pesos de la red en la superficie del error siguiendo la dirección negativa del gradiente. Determina, por tanto, la magnitud de dicho desplazamiento, influyendo así en la velocidad de convergencia del algoritmo. Valores altos de α, podrían favorecer una convergencia más rápida, pues permiten avanzar rápidamente en la superficie del error. Sin embargo, razones de aprendizaje altas pueden tener consecuencias negativas en el aprendizaje, como que el método se salte un mínimo e incluso que el método oscile alrededor del mínimo. Valores pequeños de 𝛼 podrían evitar estos problemas, aunque a costa de una convergencia más lenta del algoritmo de aprendizaje, pues la magnitud de los desplazamientos en la superficie del error es más pequeña. Un método simple para evitar la inestabilidad en el algoritmo de aprendizaje debido a la razón de aprendizaje es modificar la ley de aprendizaje dada por la ecuación 5-18 mediante la inclusión de un segundo término, llamado momento, obteniendo así la siguiente ley:

𝑤(𝑛) = 𝑤(𝑛 − 1) = −𝛼

𝜕𝑒(𝑛) 𝜕𝑤

+ 𝜂∆𝑤(𝑛 − 1)

(5.20)


Donde ∆𝑤(𝑛 − 1)= 𝑤(𝑛 − 1) − 𝑤(𝑛 − 2) es el incremento de w en la anterior iteración y 𝜂 es un número positivo que controla la importancia asignada al incremento anterior.

5.2.4.3. Proceso de aprendizaje del perceptrón multicapa Como se ha comentado en el apartado anterior, el objetivo del aprendizaje o entrenamiento del perceptrón multicapa es ajustar los parámetros de la red, pesos y umbrales, con el fin de que las entradas presentadas produzcan las salidas deseadas, es decir, con el fin de minimizar la función de error E. En esta sección se van a detallar los pasos que involucra el proceso completo de aprendizaje del perceptrón multicapa de acuerdo al algoritmo de retropropagación. Sea 𝑋(𝑛), 𝑆(𝑛), 𝑛 = 1 … 𝑁 el conjunto de muestras o patrones que representan el problema a resolver, donde 𝑋(𝑛) = (𝑥1 (𝑛), … , 𝑥𝑛1 (𝑛) ) son los patrones de entrada a la red. 𝑆(𝑛) = (𝑠1 (𝑛), … , 𝑠𝑛𝑐 (𝑛) ) son las salidas deseadas para dichas entradas y N es el número de patrones disponibles. Generalmente, es frecuente encontrar los patrones de entrada y salida normalizados o escalados mediante una transformación lineal en los intervalos [0,1] o [-1,1] dependiendo de las función de activación empleada. Los pasos que componen el proceso de aprendizaje del perceptrón multicapa son los siguientes: 1.

Se inicializan los pesos y umbrales de la red. Generalmente, esta inicialización es aleatoria y con valores alrededor de cero.

2.

Se toma un patrón del conjunto de entrenamiento. (𝑋(𝑛), 𝑆(𝑛)), y se propaga hacia la salida de la red el vector de entrada 𝑋(𝑛) utilizando las ecuaciones (5.2), (5.3) y (5.4), obteniéndose así la respuesta de la red para dicho vector de entrada, 𝑌(𝑛).

3.

Se evalúa el error cuadrático cometido por la red para el patrón 𝑛 utilizando la ecuación (5.12).

4.

Se aplica la regla delta generalizada para modificar los pesos y umbrales de la red.

5.

Se repiten los pasos 2, 3 y 4 para todos los patrones de entrenamiento,


Redes Neuronales

93

completando así un ciclo de aprendizaje, o epoch. 6.

Se evalúa el error total E ecuación (5.10) cometido por la red. Dicho error también recibe el nombre de error de entrenamiento, pues se calcula utilizando los patrones de entrenamiento.

7.

Se repiten los pasos 2, 3, 4, 5 y 6 hasta alcanzar un mínimo del error de entrenamiento, para lo cual se realizan 𝑚 ciclos de aprendizaje.

Existe una variante del proceso de aprendizaje descrito anteriormente en la que los parámetros de la red se modifican una vez que todos los patrones han sido presentados a la red, y no para cada patrón de entrenamiento. Esta variante se conoce como proceso batch. Entrenar una red neuronal para aprender patrones presentes en los datos de entrada implica presentarle de forma iterativa ejemplos de las respuestas correctas conocidas. El fin del entrenamiento es encontrar un conjunto de pesos y umbrales que determine un mínimo global en la función de error. Si el modelo no está sobreentrenado, este conjunto de parámetros debería proporcionar una correcta generalización. Los entrenamientos que utilizan el método de descenso del gradiente ajustan progresivamente dichos parámetros en la dirección de máxima pendiente decreciente en la superficie del error. Encontrar el mínimo global de dicha superficie no está garantizado ya que ésta puede incluir muchos mínimos locales en los que el proceso de entrenamiento converge. La inclusión del factor de momento en la función de aprendizaje y la ejecución del entrenamiento con varios conjuntos iniciales de distintos pesos puede mejorar las probabilidades de encontrar un mínimo global. Una ventaja de las redes neuronales es su habilidad para adaptarse a los cambios del mercado por medio de un reentrenamiento periódico. Una vez entrenada, el desempeño de una red neuronal se verá degradado a lo largo del tiempo a no ser que se reentrene. Un buen modelo debería ser robusto con respecto a la frecuencia de reentrenamiento y normalmente mejorará a medida que el reentrenamiento se realice de forma más frecuente.

5.2.4.4. Sobre-entrenamiento Cuando un sistema se entrena demasiado (se sobreentrena) o se entrena con datos


extraños, el algoritmo de aprendizaje puede quedar ajustado a unas características muy específicas de los datos de entrenamiento que no tienen relación causal con la función objetivo. Para evitar el problema del sobre-entrenamiento se crea un conjunto de validación. La función que desempeña el conjunto de validación es evaluar el error de la red tras cada epoch (o tras cada cierto número de epochs) y determinar el momento en que éste empieza a aumentar. Ya que el conjunto de validación se deja al margen durante el entrenamiento, el error cometido sobre él es un buen indicativo del error que la red cometerá sobre el conjunto de test. En consecuencia, se procederá a detener el entrenamiento en el momento en que el error de validación aumente y se conservarán los valores de los pesos del epoch anterior. Este criterio de parada se denomina early-stopping.

Figura 5-4-Punto de parada

Para obtener una aproximación funcional óptima, se deben elegir cuidadosamente las variables a emplear. Lo que se trata es de incluir en el modelo las variables predictivas que realmente predigan la variable dependiente o de salida, pero que a su vez no tengan relaciones entre sí ya que esto puede provocar un sobreentrenamiento innecesario en el modelo. Otro factor a tener en cuenta para evitar el sobre-entrenamiento es usar el mínimo número de neuronas ocultas con las cuales la red rinda de forma adecuada ya que el número de neuronas ocultas determina la capacidad de aprendizaje de la red neuronal. Esto se consigue evaluando el rendimiento de diferentes arquitecturas en función de los resultados obtenidos con el grupo de validación.


95

Redes Neuronales

5.2.5. Algoritmos de entrenamiento avanzados A continuación se muestran los principales métodos de entrenamiento avanzado.

5.2.5.1. Levenberg-Marquardt El método de Levenberg-Marquardt (LM) es un tipo de algoritmo de entrenamiento similar a los denominados quasi-Newton. Para entender la funcionalidad del método LM es conveniente empezar por comprender el método de Newton. El método de Newton es un método de segundo orden que constituye una alternativa a los métodos de gradiente conjugado para optimización rápida. El paso básico del método de Newton durante el epoch n es:

𝑤(𝑛 + 1) = 𝑤(𝑛) − 𝐻(𝑛)−1 g(n)

(5.21)

Donde w es el vector de pesos, g(n) es el vector gradiente actual y H(n) es la matriz Hessiana (de derivadas segundas) de la función de error respecto a los pesos, evaluada en los valores actuales de pesos y umbrales. El método de Newton generalmente converge más rápido que los métodos de gradiente conjugado. Desafortunadamente, la matriz Hessiana es compleja y costosa de calcular para las redes feedforward. Los algoritmos denominados quasi-Newton (método de la secante) calculan y actualizan una aproximación de la matriz Hessiana sin necesidad de resolver las derivadas de segundo orden en cada iteración. La actualización realizada es función del gradiente. Al igual que los métodos quasi-Newton, el algoritmo LM fue diseñado para acometer entrenamientos rápidos de segundo orden sin tener que calcular la matriz Hessiana. Cuando la función de error tiene la forma de una suma de cuadrados (el caso típico en las redes feedforward), entonces la matriz Hessiana puede aproximarse como:

𝐻 = 𝐽𝑇 𝐽

(5.22)

Donde J es la matriz Jacobiana que contiene las primeras derivadas de la función de


error de la red respecto a los pesos y umbrales. El gradiente se obtiene como:

𝑔 = 𝐽𝑇 𝑒

(5.23)

Siendo 𝑒 el vector de errores de la red. El cálculo de la matriz Jacobiana se reduce a un simple cálculo del algoritmo de retropropagación que es mucho más sencillo que construir la matriz Hessiana. El método LM actualiza los pesos de forma similar al método de Newton pero introduciendo los cambios anteriores:

𝑤(𝑛 + 1) = 𝑤(𝑛)[𝐽𝑇 𝐽 + 𝜇𝐼]𝐽𝑇 𝑒

(5.24)

Donde el parámetro 𝜇 actúa como tasa de aprendizaje. Cuando es cero, el algoritmo se convierte en el método de Newton empleando la forma aproximada del cálculo de la matriz Hessiana:

𝑤(𝑛 + 1) = 𝑤(𝑛)𝐻𝑔

(5.25)

Cuando 𝜇 es grande, se puede despreciar la matriz Hessiana y obtenemos el método de descenso de gradiente con un tamaño de paso (1/𝜇):

1

𝑤(𝑛 + 1) = 𝑤(𝑛) 𝑔 𝜇

(5.26)

El método de Newton es más eficaz cerca de un mínimo del error, así que el objetivo es migrar tan pronto como sea posible al método de Newton. Así pues, se reduce 𝜇 tras cada paso exitoso (cada vez que el error se logra reducir) y sólo se aumenta cuando el error aumenta respecto a la iteración anterior. Con esta metodología, la función de error siempre disminuye tras cada iteración del algoritmo.


97

Redes Neuronales

El algoritmo LM es el método más rápido para entrenar redes feedforward de tamaño moderado (hasta varios centenares de parámetros). Su principal desventaja es que requiere almacenar las matrices Jacobianas que, para ciertos conjuntos de datos, pueden ser muy grandes, lo que significa un gran uso de memoria.

5.2.5.2. Método del gradiente El método del gradiente fue introducido en el año 1847. Se basa en una aproximación lineal de la función a minimizar (la función error), actualizando la variable a modificar (los pesos) en dirección contraria al gradiente, tal y como se muestra en la ecuación (5.27).

𝐸𝑇 (𝑤 + ∆𝑤) ≈ 𝐸𝑇 (𝑤) + ∆𝑤 ∗ ∇𝐸𝑇 (𝑤) ∆𝑤 = −𝜌∆𝐸𝑇 (𝑤)

𝜌>0

(5.27)

La aplicación de este método junto con la aplicación de la regla de la cadena para propagar hacia las capas iniciales la información del error entre los valores de la red y los previstos por el entrenamiento, es lo que constituye el algoritmo estándar de Retropropagación. El factor de aprendizaje 𝜌 permite controlar el grado de modificación de los pesos en el algoritmo de entrenamiento. Además, la elección de este factor influye tanto en la rapidez como en la eficiencia del propio entrenamiento. Por una parte con un factor grande de aprendizaje se podría obtener mayor rapidez en la optimización, pero a su vez también se observaría mayor tendencia a las oscilaciones en la superficie del error que se intenta minimizar. Por otra parte, con un factor pequeño, la convergencia a un mínimo sería más lenta, pero la posibilidad de pasar por alto un mínimo en el error. Dependiendo también del factor de aprendizaje se puede tener más o menos éxito para evitar el estancamiento del algoritmo en mínimos locales. Los algoritmos de descenso por gradiente presentan la gran ventaja de ser simples y fáciles de implementar, aunque en algunos casos sus tiempos de convergencia pueden ser muy altos. Para intentar salvar estos inconvenientes también han surgido diversas implementaciones dentro de este tipo de optimización.


5.2.5.3. Método de cuasi-Newton Dado que la inversa de la matriz Hessiana puede ser muy complicada o imposible de obtener de forma explícita, en los métodos cuasi-Newton se sustituye la inversa de Hessiano real por una aproximación de valor positivo generada a partir de dos gradientes de iteraciones sucesivas de la función error. De esta manera se consigue por una parte la rapidez de convergencia de los métodos de Newton evitando los problemas de estabilidad y por otra sólo requiere la información de las derivadas de primer orden. En contraposición, necesitan almacenar en memoria las matrices de cada iteración, lo que puede representar un problema importante si el número de pesos a ajustar en la red es alto. Uno de los métodos más potente existentes en la actualidad es el BFGS (Broyden Fletcher Goldfarb-Shanno).

5.2.5.4. Método del gradiente conjugado Los métodos del gradiente conjugado son un paso intermedio entre los métodos del gradiente y los métodos de Newton, ya que por una parte intentan mejorar la convergencia de los métodos de descenso por gradiente y por otra evitan el cálculo y el almacenamiento de la información requerida en un método de Newton. La característica principal de este tipo de métodos es que, asumiendo que la función error es cuadrática, intentan conseguir direcciones de búsqueda que no interfieran con las realizadas en las iteraciones anteriores. De todas maneras este tipo de métodos suelen requerir alrededor del doble de cálculos de gradientes que los cuasi-Newton, pero son capaces de reducir el tiempo y la memoria requerida para determinar la matriz Hessiana para problemas de altas dimensiones. Algunas implementaciones de este método son las de Flecher-Reeves o la de Polak-Ribiere.

5.2.5.5. Regulación bayesiana La regularización constituye un criterio de parada de entrenamiento alternativo al early-stopping visto en el apartado 5.2.4.4. El método de regularización bayesiana (BR) implica modificar la función de coste, normalmente el MSE (error cuadrático medio). El MSE sobre el conjunto de datos de test (𝑀𝑆𝐸𝑑 ) se expresa mediante una suma de cuadrados de los errores individuales 𝑒𝑖 de cada muestra de un conjunto de test de N datos de la siguiente forma:

1

2 𝑀𝑆𝐸𝑑 = ∑𝑁 𝑖=1(𝑒𝑖 ) 𝑁

(5.28)


99

Redes Neuronales

La modificación comentada tiene el propósito de mejorar la capacidad de generalización del modelo. Para conseguirlo, la función de coste de la ecuación (5.29) se amplía con la adición de un término 𝑀𝑆𝐸𝑤 que incluye el efecto de la suma de cuadrados de los pesos de la red. Es decir:

1

2 𝑀𝑆𝐸𝑤 = ∑𝑁 𝑖=1(𝑒𝑤 ) 𝑁

(5.29)

Y la función de coste modificada queda:

𝑀𝑆𝐸 = 𝛽𝑀𝑆𝐸𝑑 + 𝛼𝑀𝑆𝐸𝑤

(5.30)

Donde 𝛼 y 𝛽 son parámetros que deben ser ajustados según una metodología que asume que los pesos y umbrales son variables aleatorias que siguen distribuciones específicas (normalmente Gaussianas). Los parámetros de regularización están relacionados con las varianzas desconocidas asociadas a estas distribuciones. Se pueden estimar estos parámetros mediante técnicas estadísticas. Una característica de dicho algoritmo es que proporciona una medida de cuántos parámetros de la red (pesos y umbrales) están siendo efectivamente usados por ésta. El número de parámetros efectivos debería llegar a ser aproximadamente constante, sin importar cuánto de grande se haga el número de parámetros “reales" de la red. Para esto se asume que la red ha sido entrenada durante suficientes epochs y que el entrenamiento ha convergido. Se conoce que la técnica de regularización óptima requiere la costosa construcción de la matriz Hessiana. Un algoritmo que se emplea a menudo en combinación con la técnica de regularización Bayesiana es el algoritmo LM.


6. REDES NEURONALES EN MATLAB® “No hay camino para la verdad, la verdad es el camino” - Mahatma Gandhi-

MATLAB (abreviatura de MATrix LABoratory, "laboratorio de matrices") es una herramienta de software matemático que ofrece un entorno de desarrollo integrado (IDE) con un lenguaje de programación propio (lenguaje M). Posee una serie de aplicaciones capaces de emular Redes Neuronales Artificiales.

6.1. Arquitectura de las Redes Neuronales en MATLAB® En la Figura 6-1 se representa el esquema de una red neuronal con una sola entrada. La entrada escalar (input) p es multiplicada por un peso escalar w para formar wp. La otra entrada, 1, es multiplicada por una bias, b. Estos términos son utilizados en la función de activación, también llamada función de transferencia, la cual produce la salida escalar a.


101

Redes Neuronales en MATLAB®

Figura 6-1-Esquema RNA La neurona de salida es calculada por: 𝑎 = 𝑓(𝑤𝑝 + 𝑏)

(6.1)

Obviamente, la salida actual depende de la función de activación elegida. La bias es muy similar a los pesos, exceptuando que ésta tiene una entrada constante de valor 1. Note que w y b son ambos parámetros escalares ajustables. Normalmente la función de activación es elegida por el diseñador de la red y luego los parámetros w y b serán ajustados según alguna regla que relacione la entrada y la salida por alguna meta específica. En el apartado 5.2.2 se ha comentado que las funciones de activación más usuales son la tangente hiperbólica y la sigmoidal pero MATLAB® ofrece una variedad de estas funciones. En la siguiente tabla se muestra todas las funciones de activación disponibles en MATLAB®.


Figura 6-2-Funciones activación MATLAB

Típicamente una red de neuronas tiene más de una entrada. Una red con R entradas se muestra en la Figura 6-3, donde las entradas individuales 𝑝1 , … , 𝑝𝑅 son ponderadas por su elemento correspondiente 𝑤1,1 , … , 𝑤1,𝑅 de la matriz de pesos W.


103

Redes Neuronales en MATLAB®

Figura 6-3-Múltiples entradas La red tiene una bias, la cual se suma con las entradas ponderas para formar la entrada neta: 𝑛 = 𝑤1,1 𝑝1 + ⋯ + 𝑤1,𝑅 𝑝𝑅 + 𝑏 Esta expresión puede ser escrita de forma matricial de la siguiente forma: 𝑛 = 𝑤𝑝 + 𝑏 Donde la matriz W para el caso de una sola neurona tiene una única fila. Ahora la neurona de salida puede ser escrita como: 𝑎 = 𝑓(𝑤𝑝 + 𝑏) Aclarar que el primer índice en un elemento de la matriz de peso indica el destino para ese peso y el segundo índice indica la fuente de la señal alimentada a la neurona. Así, los índices en, por ejemplo, 𝑤1,2 nos dicen que este peso representa la conexión a la primera (y única) neurona desde la segunda fuente. Se muestra en la Figura 6-4-Notación abreviada RNA una anotación abreviada para una red de neuronas con una serie de entradas y para más de una capa de neuronas.


Figura 6-4-Notación abreviada RNA

Comúnmente una neurona, a menudo con muchas entradas, puede no ser suficiente. Podríamos necesitar de cinco a diez, operando en paralelo, en lo que llamamos una “capa”.

Figura 6-5-Esquema RNA

La Figura 6-5 muestra una red de una sola capa de S neuronas. Cada R entradas está conectada a cada una de las neuronas y que los matriz de pesos tiene ahora S filas. La capa incluye la matriz de pesos, los sumatorios, el vector bias b, la función de activación y el vector de salida a. Algunos autores pueden referirse a las entradas


Redes Neuronales en MATLAB®

105

como otra capa pero esto no será considerado aquí. Cada elemento del vector de entrada p es conectada por cada neurona a través de la matriz de pesos W. Cada neurona tiene una bias 𝑏𝑖 , un sumatorio, una función de activación 𝑓 y una salida 𝑎𝑖 . Tomado juntamente, las salidas forman el vector de salida a. Es común que el número de entradas de una capa sea diferente al número de neuronas, es decir 𝑅 ≠ 𝑆. Es posible tener diferentes funciones de activación para las neuronas de una capa. Se puede definir una única capa de neuronas teniendo diferentes funciones de activación por combinación de dos de las redes mostradas anteriormente en paralelo. Ambas redes tendrían las mismas entradas, y cada red crearía algunas de las salidas. El vector de los elementos de entrada entra en la red a través de la matriz de pesos: 𝑤1,1 ⋯ 𝑤1,𝑅 ⋱ ⋮ ] W=[ ⋮ 𝑤𝑆,1 ⋯ 𝑤𝑆,𝑅 Afortunadamente, la S-neurona, R-entrada y la red de una capa puede ser también representada con una anotación abreviada, como en la siguiente Figura 6-6:

Figura 6-6-Notación abreviada Aquí de nuevo, los símbolos de debajo de las variables dicen que para esta capa, p es un vector de longitud R, W es una matriz de SxR, y a y b son vectores de longitud S. Como se definió previamente, la capa incluye la matriz de pesos, las operaciones sumatorias y multiplicadoras, el vector de bias b, la función de activación y el vector de salida.


Pero se puede considerar redes con más de una capa. Cada capa tiene su propia matriz de pesos W, su propio vector de bias b, un vector neto n y un vector de salida a. Es necesario introducir algunas anotaciones adicionales para distinguir entre estas capas. Será necesario usar superíndices para identificar las capas. Específicamente, se añade el número de la capa como superíndice en los nombres de cada una de estas variables. Así, la matriz de pesos de la primera capa será escrita como 𝑊 1 , y la matriz de pesos de la segunda capa es escrita como 𝑊 2 . Ésta anotación es usada para mostrar una red con tres capas en la Figura 6-7.

Figura 6-7-RNA tres capas

Como se muestra en la Figura 6-7, hay R entradas,𝑆 1 neuronas en la primera capa, 𝑆 2 neuronas en la segunda capa, etc. Anotar que diferentes capas pueden tener diferentes números de neuronas. Las salidas de las capas uno y dos son las entradas de las capas dos y tres. Así, la capa 2 puede ser vista como una red de una capa con 𝑅 = 𝑆 1 entradas, S=𝑆 2 neuronas, y una 𝑆 2 𝑥𝑆 1 matriz de pesos 𝑊 2 . La entrada para la capa 2 es 𝑎1 , y la salida es 𝑎2 . Será llamada como capa de salida aquella capa cuya salida es la salida de la red. Las otras capas son llamadas capas ocultas. La Figura 6-8 muestra la anotación abreviada para una red con tres capas donde la capa de salida es la capa 3 y las capas ocultas son las capas 1 y 2.


Redes Neuronales en MATLAB®

107

Figura 6-8-RNA tres capas abreviadas

6.2. Neural Network Toolbox Product Description Neural Network Toolbox ™ proporciona funciones y aplicaciones para modelar sistemas no lineales complejos que no son fácilmente modelados sistemas de ecuaciones. Neural Network Toolbox soporta el aprendizaje supervisado con redes feedforward, radiales y dinámicas. También apoya el aprendizaje sin supervisión con mapas auto-organizados y capas competitivas. Con Neural Network Toolbox puede diseñar, entrenar, visualizar y simular redes neuronales. Se puede utilizar Neural Network Toolbox de redes neuronales para aplicaciones tales como ajuste de datos, reconocimiento de patrones, agrupación, predicción de series de tiempo y modelado y control de sistemas dinámicos. Características principales: 

Las redes supervisadas, incluyendo la base radial de múltiples capas, la cuantificación del vector de aprendizaje (LVQ), el retardo de tiempo, la autorregresión no lineal (NARX) y la recurrencia de capa.

Redes no supervisadas, incluyendo mapas auto-organizados y capas competitivas.

Aplicaciones para ajuste de datos, reconocimiento de patrones y agrupación de clústeres.


Computación paralela y soporte de GPU para acelerar el entrenamiento (usando Neural Network Toolbox de computación paralela).

Preprocesamiento y postprocesamiento para mejorar la eficiencia de la formación en red y evaluar el rendimiento de la red.

Representación de red modular para gestionar y visualizar redes de tamaño arbitrario.

Bloques Simulink® para la construcción y evaluación de redes neuronales y para aplicaciones de sistemas de control.

6.3. Uso de Neural Network Times SeriesTool Seleccionando Time Series app en la ventada nnstart que se muestra en la Figura 6-9 o directamente a través del comando ntstool se accede a la creación de una red de tipo NARX. Una vez hecho clic se accede a la ventana que muestra la Figura 6-10. a)

Se abre Neural Network Start GUI Comando: nnstart.

Figura 6-9-nnstart


109

Redes Neuronales en MATLAB®

Aquí aparecen varios tipos de problemas a resolver, en nuestro caso la predicción de cotizaciones se considera una serie temporal dinámica.

Figura 6-10-More information

En la siguiente pestaña aparecen ejemplos y documentación acerca de las redes neuronales, muy útiles para éste proyecto en concreto. b) Click en Time Series APP Una vez aquí se pueden seleccionar tres tipos de series temporales: 

Redes NARX

Figura 6-11-Red NARX


Redes NAR

Figura 6-12-Red NAR 

Redes No lineales

Figura 6-13-Red no lineal Se utilizan las redes tipo NARX porque son las más precisas respecto a los data que se disponen.


111

Redes Neuronales en MATLAB®

Figura 6-14-ntstool Se muestra una pequeña introducción a este tipo de redes, un esquema de la arquitectura de las mismas. En nuestro caso, se selecciona la tipo NARX, ya que tendremos cinco entradas externas y el propio valor de las cotizaciones. c)

Click en Next


Figura 6-15-Select data Se seleccionan los datos para inputs y Targets.


113

Redes Neuronales en MATLAB®

Figura 6-16-Inputs/Targets En nuestro caso, los inputs serán los datos de entrada en los que se basarán las predicciones del precio final, tales como: precio apertura, volúmenes de transacciones, valor MADC, DIF (2), RSI. Los targets serán los propios precios de la cotización. d) Clic en Next para abrir la ventana de Validation and Test Data Por defecto aparece un 15% de la muestra que se utilizará para el conjunto de validación y otro 15% que se utilizará para el test. Estos porcentajes pueden ser modificados, cambiándose de manera automática el porcentaje del conjunto de entrenamiento para el caso que se decida modificar los porcentajes de validación y/o test. Recordar que el conjunto de validación es utilizado para parar el entrenamiento antes de que ocurra el sobreentrenamiento.


Figura 6-17-Validation and test data

e)

En la siguiente pestaña se muestra la Arquitectura de la Red. Se puede seleccionar el número de neuronas ocultas y también el número de desfase o retraso tenido en cuenta en la Red. Como se observa en el esquema, se tienen 2 entradas, x (t) y (t), y una sola salida y (t).


115

Redes Neuronales en MATLAB®

Figura 6-18-Arquitectura NARX

f)

Una vez seleccionados los parámetros de la red se clickea en next y se procede al entrenamiento de dicha Red Neuronal. Como se puede ver existen 3 tipos de entrenamientos explicados en el apartado 5.2.5.


Figura 6-19-Entrenamiento RNA Una vez elegido el algoritmo de entrenamiento, se entrena la red, y se muestran los resultados como en la Figura 6-20-RNA entrenada.


117

Redes Neuronales en MATLAB®

Figura 6-20-RNA entrenada

Donde MSE significa la media de los errores cuadráticos, cuanto más cercanos a ceros, menos errores cometidos. R significa la correlación existente entre los valores de salida y el objetivo, un valor R~1 significa una estrecha relación entre ambos. La siguiente figura, es la ventana emergente donde se muestra el entrenamiento de la red, con el progreso en tiempo real de los siguientes factores: 

Número de interacciones

Tiempo de ejecución

Rendimiento

Gradiente

𝜇

Validaciones


Figura 6-21-Entrenamiento RNA Al finalizar se muestran los siguientes gráficos donde se aprecian los errores cometidos durante el entrenamiento de la Red

Figura 6-22-Error entrenamiento


119

Redes Neuronales en MATLAB®

Figura 6-23

La Figura 6-24 muestra el esquema de la RNA para la predicción de la semana siguiente.

Figura 6-24


7. PREVISIÓN DE VALORES DE ÍNDICES EN ENTORNO MATLAB® “Pensar es el trabajo más difícil que existe. Quizá sea ésta la razón por la que haya pocas personas que lo practiquen” - Henry Ford-

En este capítulo se trata el método de resolución que se ha llevado a cabo para resolver el problema planteado. Utiliza dos plataformas totalmente diferentes como son MATLAB y EXCEL, en la primera se ejecuta el algoritmo de la RNA, y en Excel se tratan los datos a priori y posteriori hasta tener como solución un valor de previsión y un sentido de tendencia en timeframe semanal. Este proyecto se centra en la previsión de las cotizaciones de los principales Índices mundiales, ya que tienen un comportamiento más técnico (son más fieles a las reglas del análisis técnico) que valores individuales de empresas. Aún así, el algoritmo explicado a continuación es perfectamente válido para previsiones de cualquier elemento que cotice en los mercados financieros.

7.1. Algoritmo utilizado Para la resolución del problema se ha utilizado el algoritmo representado en el siguiente diagrama de flujo, Figura 7-1. El cual, una vez configurados los valores predeterminados de los parámetros de entrenamiento de la red, se ejecuta un bucle que aborda el mismo problema desde diferentes parámetros de la Red como son el número de neuronas y el número de medidas anteriores a tener en cuenta. Esto se hace para obtener un gran número de previsiones desde diferentes modos de abordar el problema. Una vez obtenidos todos los resultados de cada vuelta del bucle, se sintetiza la información, se realiza un análisis estadístico y se evalúa el


Previsión de valores de índices en entorno MATLAB®

121

valor final de la salida (precio de cierre) de la semana a predecir. Por lo tanto cabe decir que no se realiza un algoritmo de optimización de parámetros, si no que se modifican y todos los resultados obtenidos son tratados posteriormente.

Figura 7-1-Diagrama flujo Al iniciar el Algoritmo se configuran los parámetros a utilizar, el número de neuronas a utilizar num_neurons y el número de días considerados para la previsión num_delays. En éste proyecto, el número de neuronas a utilizar está asociado con la Serie de Fobinacci, es decir, num_neurons= 1, 2, 3, 5, 8, 13 y 21. Y el número de días considerados también está asociado con la Serie de Fobinacci, num_delays= 1, 2, 3, 5,8, 13, 21 y 34. Para cada valor del número de neuronas, el algoritmo se ejecuta para todos y cada


uno de los valores mencionados de días considerados. Por lo tanto, se generan tantas previsiones de la cotización como bucles tiene el algoritmo. Una vez finalizada la ejecución, el algoritmo devuelve una Matriz con todos los valores obtenidos para cada una de las ejecuciones. Éstos valores son utilizados en un posterior análisis estadístico con Microsoft Excel®. Se recuerda que el timeframe analizado es semanal, por lo tanto la previsión es sobre el valor de cierre de la semana siguiente. La predicción del precio es sólo una manera más de predecir la tendencia semanal, si la cotización prevista es superior a la de la última semana, la tendencia es alcista, y en caso contrario la tendencia es bajista. La longitud de los datos utilizados es de 124 semanas.

7.1.1. Teoría de los Grandes Números En la teoría de la probabilidad, bajo el término genérico de ley de los grandes números se engloban varios teoremas que describen el comportamiento del promedio de una sucesión de variables aleatorias conforme aumenta su número de ensayos. Estos teoremas prescriben condiciones suficientes para garantizar que dicho promedio converge (en los sentidos explicados abajo) al promedio de las esperanzas de las variables aleatorias involucradas. Las distintas formulaciones de la ley de los grandes números (y sus condiciones asociadas) especifican la convergencia de formas distintas. Las leyes de los grandes números explican por qué el promedio de una muestra al azar de una población de gran tamaño tenderá a estar cerca de la media de la población completa. Cuando las variables aleatorias tienen una varianza finita, el teorema central del límite extiende nuestro entendimiento de la convergencia de su promedio describiendo la distribución de diferencias estandarizadas entre la suma de variables aleatorias y el valor esperado de esta suma: sin importar la distribución subyacente de las variables aleatorias, esta diferencia estandarizada converge a una variable aleatoria normal estándar. La frase "ley de los grandes números" es también usada ocasionalmente para


Previsión de valores de índices en entorno MATLAB®

123

referirse al principio de que la probabilidad de que cualquier evento posible (incluso uno improbable) ocurra al menos una vez en una serie, incrementa con el número de eventos en la serie.

7.1.2. Plantillas Excel Para representar los resultados se ha utilizado el programa Microsoft Excel®, haciendo uso de dos plantillas: 

Inputs -Outputs.xlsx

Comparación.xlsx

7.1.2.1. Inputs-Outputs.xlsx En la hoja de cálculo Inputs-Outputs.xlsx se muestran cinco pestañas, la primera es la principal, y en la que se basan todas las demás, los valores de las cotizaciones, así como su volumen, precio más alto y precio más bajo. Estos valores son descargados directamente de la página web oficial http://finance.yahoo.com. Con dichos valores se calculan el valor de los indicadores MACD y RSI mencionados en apartados anteriores.


Figura 7-2-Plantilla IMP/OUT Automáticamente se generan en las siguientes pestañas los valores de los INPUTS y TARGETS a tener en cuenta para la Red Neuronal. Los INPUTS son cinco: 

OPEN: valor de apertura de la cotización en semanal.

VOLUME: volumen de transacciones ocurridas durante la semana.

MADC: valor del MACD en semanal

DIF (2): diferencia entre la señal MACD y la media ponderada de MACD durante nueve periodos MACD (9).

RSI (14): valor indicador RSI para 14 periodos.

El TARGET es el valor de cierre de la cotización en semanal. Es el valor que se predice para la siguiente semana.

Figura 7-3-Inputs


Previsión de valores de índices en entorno MATLAB®

125

Figura 7-4-Targets

En la siguiente pestaña, Figura, se muestra el valor de la cotización representado en un diagrama de Velas Japonesas

Figura 7-5-Cotización


Y en la última pestaña, Figura 7-6, se representan visualmente los valores del MACD (muy importante para las divergencias), siempre con un timeframe semanal

Figura 7-6 Por lo tanto en esta plantilla de Excel, se introducen los datos en bruto proporcionados por la web, y se realizan con cálculos necesarios para su procesamiento en MATLAB®.

7.1.2.2. Comparación.xlsx Una vez ejecutado el algoritmo con los datos calculados en la plantilla anterior, el resultado es una Matriz de dimensiones num_neurons x num_delays, los valores obtenidos en dicha matriz se copian en la plantilla Excel llamada Comparación.xlsx. Aquí se realizan varios estudios estadísticos, se calcula la media total y en base a ella se establece la tendencia actual (alcista o bajista).


Previsión de valores de índices en entorno MATLAB®

127

Figura 7-7

Este proyecto realiza una previsión de las cotizaciones, basándose en la Ley de los Grandes Números se toma una muestra bastante representativa de la población, y se trabaja con el valor promedio de dicha población.

7.1.3. Código MATLAB % Solve an Autoregression Problem with External Input with a NARX Neural Network % This script assumes these variables are defined: % % DOWJONESINDA - input time series. % DOWJONESINDA0x2D3y0x2Dw0x2Dtar - feedback time series. X = tonndata(IBEX350x2D3y0x2Dw0x2Dimp,false,false); T = tonndata(IBEX350x2D3y0x2Dw0x2Dtargets,false,false); num_delays=8; num_neurons=7; % % % % % % % %

if j==8 neurons=34; end Choose a Training Function For a list of all training functions type: help nntrain 'trainlm' is usually fastest. 'trainbr' takes longer but may be better for challenging problems.


% 'trainscg' uses less memory. Suitable in low memory situations. trainFcn = 'trainlm'; % Levenberg-Marquardt backpropagation. % Create a Nonlinear Autoregressive Network with External Input inputDelays = 1:delay; feedbackDelays = 1:delay; hiddenLayerSize = neurons; net = narxnet(inputDelays,feedbackDelays,hiddenLayerSize,'open',trainFcn); % Choose Input and Feedback Pre/Post-Processing Functions % Settings for feedback input are automatically applied to feedback output % For a list of all processing functions type: help nnprocess % Customize input parameters at: net.inputs{i}.processParam % Customize output parameters at: net.outputs{i}.processParam net.inputs{1}.processFcns = {'removeconstantrows','mapminmax'}; net.inputs{2}.processFcns = {'removeconstantrows','mapminmax'}; % Prepare the Data for Training and Simulation % The function PREPARETS prepares timeseries data for a particular network, % shifting time by the minimum amount to fill input states and layer % states. Using PREPARETS allows you to keep your original time series data % unchanged, while easily customizing it for networks with differing % numbers of delays, with open loop or closed loop feedback modes. [x,xi,ai,t] = preparets(net,X,{},T); % Setup Division of Data for Training, Validation, Testing % For a list of all data division functions type: help nndivide net.divideFcn = 'dividerand'; % Divide data randomly net.divideMode = 'time'; % Divide up every sample net.divideParam.trainRatio = 70/100; net.divideParam.valRatio = 15/100; net.divideParam.testRatio = 15/100; % Choose a Performance Function % For a list of all performance functions type: help nnperformance net.performFcn = 'mse'; % Mean Squared Error % Choose Plot Functions % For a list of all plot functions type: help nnplot net.plotFcns = {'plotperform','plottrainstate', 'ploterrhist', ... 'plotregression', 'plotresponse', 'ploterrcorr', 'plotinerrcorr'}; % Train the Network [net,tr] = train(net,x,t,xi,ai); % Test the Network y = net(x,xi,ai); e = gsubtract(t,y); performance = perform(net,t,y)


Previsión de valores de índices en entorno MATLAB®

129

% Recalculate Training, Validation and Test Performance trainTargets = gmultiply(t,tr.trainMask); valTargets = gmultiply(t,tr.valMask); testTargets = gmultiply(t,tr.testMask); trainPerformance = perform(net,trainTargets,y) valPerformance = perform(net,valTargets,y) testPerformance = perform(net,testTargets,y) % View the Network %view(net) % Plots % Closed Loop Network % Use this network to do multi-step prediction. % The function CLOSELOOP replaces the feedback input with a direct % connection from the outout layer. netc = closeloop(net); netc.name = [net.name ' - Closed Loop']; %view(netc) [xc,xic,aic,tc] = preparets(netc,X,{},T); yc = netc(xc,xic,aic); closedLoopPerformance = perform(net,tc,yc) % Multi-step Prediction % Here all but 5 timesteps of the input series and target series are used % to simulate the network in open-loop form, taking advantage of the higher % accuracy that providing the target series produces: numTimesteps = size(x,2); knownOutputTimesteps = 1:(numTimesteps-5); predictOutputTimesteps = (numTimesteps-4):numTimesteps; X1 = X(:,knownOutputTimesteps); T1 = T(:,knownOutputTimesteps); [x1,xio,aio] = preparets(net,X1,{},T1); [y1,xfo,afo] = net(x1,xio,aio); % Next the the network and its final states will be converted to % closed-loop form to make five predictions with only the five inputs % provided. x2 = X(1,predictOutputTimesteps); [netc,xic,aic] = closeloop(net,xfo,afo); [y2,xfc,afc] = netc(x2,xic,aic); multiStepPerformance = perform(net,T(1,predictOutputTimesteps),y2) % Alternate predictions can be made for different values of x2, or further % predictions can be made by continuing simulation with additional external % inputs and the last closed-loop states xfc and afc. % % % % % %

Step-Ahead Prediction Network For some applications it helps to get the prediction a timestep early. The original network returns predicted y(t+1) at the same time it is given y(t+1). For some applications such as decision making, it would help to have predicted y(t+1) once y(t) is available, but before the actual y(t+1) occurs. The network can be made to return its output a


% timestep early by removing one delay so that its minimal tap delay is now % 0 instead of 1. The new network returns the same outputs as the original nets = removedelay(net); nets.name = [net.name ' - Predict One Step Ahead']; %view(nets) [xs,xis,ais,ts] = preparets(nets,X,{},T); ys = nets(xs,xis,ais); stepAheadPerformance = perform(nets,ts,ys) % Deployment % Change the (false) values to (true) to enable the following code blocks. % See the help for each generation function for more information. if (false) % Generate MATLAB function for neural network for application % deployment in MATLAB scripts or with MATLAB Compiler and Builder % tools, or simply to examine the calculations your trained neural % network performs. genFunction(net,'myNeuralNetworkFunction'); y = myNeuralNetworkFunction(x,xi,ai); end if (false) % Generate a matrix-only MATLAB function for neural network code % generation with MATLAB Coder tools. genFunction(net,'myNeuralNetworkFunction','MatrixOnly','yes'); x1 = cell2mat(x(1,:)); x2 = cell2mat(x(2,:)); xi1 = cell2mat(xi(1,:)); xi2 = cell2mat(xi(2,:)); y = myNeuralNetworkFunction(x1,x2,xi1,xi2); end if (false) % Generate a Simulink diagram for simulation or deployment with. % Simulink Coder tools. gensim(net); end nets = removedelay (net); [Xs, xis, ais, ts] = preparets (nets, {}, {}, tc); ys = nets (xs, xis, ais) final(i,j)=ys(length(ys)); end end


131

Análisis y resultados

8. ANÁLISIS Y RESULTADOS “Me gustan más los sueños del futuro que la historia del pasado” - Thomas Jefferson-

En éste capítulo se analizan los principales resultados obtenidos en las previsiones, dichos valores previstos serán sobre los Índices mundiales más importantes como S&P500, DAX30, IBEX35, NASDAQ, etc. Para cada Índice se realizarán previsiones semanales, durante 4 semanas, para comprobar las tendencias, cambios de tendencias y la validación de la Red Neuronal para este tipo de previsiones. Como se vio anteriormente cada solución es la media aritmética de todos los valores que forman una matriz de dimensiones num_neurons * num_delays, en los siguientes resultados se muestra dicha matriz, la solución final obtenida, la variación del valor predicho con respecto al valor real, y la tendencia predicha frente a la tendencia real (tendencia semanal)

8.1. Análisis de Índices Los elementos más fieles al análisis técnico son sin ninguna duda los índices mundiales, dichos índices reúnen las cotizaciones de un conjunto de valores, por lo que suavizan los cambios bruscos.

8.1.1. DAX 30 El índice Dax está compuesto por las 30 principales empresas cotizadas de la Bolsa de Fráncfort seleccionadas por capitalización y contratación. Ningún valor puede


tener un peso superior al 30%. Su composición se revisa anualmente en el mes de septiembre. Su capitalización bursátil actual es de 805.118 millones de euros que corresponde al valor total de las 30 empresas del Xetra Dax Alemán. En la Figura 8-1 se muestran los valores obtenidos al aplicar la red neuronal sobre la semana del 03/04/2017, los datos se muestran en una imagen extraída de la plantilla comparación.xlsx

Figura 8-1-DAX

En la Figura 8-2 se muestra un resumen de la imagen anterior, en la cual se compara la tendencia prevista y la tendencia real de dicho activo, analizando el error relativo entre la cotización prevista y la cotización real.

03/04/2017

Anterior

Previsión

Real

Valor €

12312.87

12019.76

12225.06

1.68%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Figura 8-2-DAX

Error relativo


133

Análisis y resultados

A continuación, los resultados obtenidos para la semana del 10/04/2017, se aprecian en la Figura 8-3 y la Figura 8-4.

Figura 8-3-DAX

La tendencia real y la prevista siguen siendo bajistas, como se observa en la Figura 8-4. El error relativo es del 0.72%, un valor razonable.

10/04/2017

Anterior

Previsión

Real

Valor €

12225.06

12021.38

12109

0.72%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Error relativo

Figura 8-4-DAX

Los siguientes resultados son los obtenidos para la semana del 17/04/2017, se muestran en la Figura 8-5 y la Figura 8-6.


Figura 8-5-DAX

La tendencia en esta semana también se predice con éxito, siendo bajista, y el error relativo entre las cotizaciones de 0.67%

17/04/2017 Valor € Tendencia

Anterior

Previsión

Real

12109

11967.83

12048.57

0.67%

BAJISTA

TENDENCIA CORRECTA

BAJISTA

Error relativo

Figura 8-6-DAX

Las previsiones para la semana del 24/04/2017 se muestran a continuación en la Figura 8-7 y la Figura 8-8.


135

Análisis y resultados

Figura 8-7-DAX

En este caso, la tendencia prevista y la tendencia real no coinciden, siendo el error relativo cometido entre la previsión y el valor real de 3.89%.

24/04/2017

Anterior

Previsión

Real

Error relativo

Valor €

12048.57

11982.41

12467.04

3.89%

BAJISTA

ALCISTA

ERROR TENDENCIA

Tendencia

Figura 8-8-DAX

A continuación, en la Figura 8-9, se muestra un resumen de las cuatro semanas analizadas, junto a un balance final de pérdidas y ganancias porcentual. El balance en este Índice ha sido negativo (-1.18%). Las ganancias/pérdidas se calculan según los precios reales de entrada y salida del mercado, es decir, el precio de la previsión sólo se utiliza para predecir la tendencia semanal.

03/04/2017 10/04/2017

Previsión BAJISTA BAJISTA

Real BAJISTA BAJISTA

Ganancias/Pérdidas 0.72% 0.96%


17/04/2017 24/04/2017

BAJISTA BAJISTA

BAJISTA ALCISTA TOTAL

0.50% -3.36% -1.18%

Figura 8-9-DAX

En la Figura 8-10 se muestran las cuatro semanas analizadas señaladas con amarillo, donde se parecía claramente el GAP ocurrido en la última semana. Estos huecos son poco frecuentes en el mercado y muy difíciles de predecir.

Figura 8-10-DAX

8.1.2. DOW JONES El Promedio Industrial Dow Jones también conocido como Dow Jones Industrial Average (DJIA) refleja el comportamiento del precio de la acción de las 30 compañías industriales más importantes y representativas de Estados Unidos. En la Figura 8-11 se muestran los valores obtenidos al aplicar la red neuronal sobre


137

Análisis y resultados

la semana del 03/04/2017, los datos se muestran en una imagen extraída de la plantilla comparación.xlsx

Figura 8-11-DJIA En la Figura 8-12 se muestra un resumen de la imagen anterior, en la cual se compara la tendencia prevista y la tendencia real de dicho activo.

03/04/2017

Anterior

Previsión

Real

Valor $

20663.22

20473.21

20656.1

0.89%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Error relativo

Figura 8-12-DJIA

A continuación, los resultados obtenidos para la semana del 10/04/2017, se aprecian en la Figura 8-14 y la Figura 8-15.


Figura 8-13-DJIA

La tendencia prevista y real coinciden, siendo el error relativo entre el precio previsto y el real de un 0.02%, una aproximación realmente buena.

10/04/2017

Anterior

Previsión

Real

Valor $

20656.1

20449.44

20453.25

0.02%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Error relativo

Figura 8-14-DJIA

Los siguientes resultados son los obtenidos para la semana del 17/04/2017, se muestran en la Figura 8-15 y la Figura 8-16.


139

Análisis y resultados

Figura 8-15-DJIA

La semana del 17/04/2017 no se predice la tendencia correcta, siendo el error relativo de un 0.88%.

17/04/2017

Anterior

Previsión

Real

Error relativo

Valor $

20453.25

20367

20547.76

0.88%

BAJISTA

ALCISTA

ERROR TENDENCIA

Tendencia

Figura 8-16-DJIA

Las previsiones para la semana del 24/04/2017 se muestran a continuación en la Figura 8-17 y la Figura 8-18.


Figura 8-17-DJIA

La red neuronal acierta esta vez con la tendencia del índice americano, siendo alcista y con un error relativo entre valores de las cotizaciones de un 1.7%, esto indica que la subida del valor es mayor de la prevista.

24/04/2017

Anterior

Previsión

Real

Valor $

20547.76

20640.19

20996.12

1.70%

ALCISTA

TENDENCIA CORRECTA

Tendencia

ALCISTA

Error relativo

Figura 8-18-DJIA

La Figura 8-19, resume las cuatro previsiones semanales y las correspondientes ganancias/pérdidas obtenidas si aplicáramos éste algoritmo. Se tendrían unas ganancias de un 2.7% mensual, es decir un 28.4% anual.

03/04/2017 10/04/2017 17/04/2017 24/04/2017

Previsión BAJISTA BAJISTA BAJISTA ALCISTA

Real BAJISTA BAJISTA ALCISTA ALCISTA TOTAL

Ganancias/Pérdidas 0.03% 0.99% -0.46% 2.14% 2.70%


141

Análisis y resultados

Figura 8-19-DJIA

En la siguiente figura, Figura 8-20, se muestran las cotizaciones de las semanas analizadas dentro del cuadro amarillo, se puede observar de nuevo el GAP producido, aunque esta vez se ha previsto con la Red Neuronal. La segunda semana analizada está acompañada de un cambio en la tendencia semanal, predicho por la red.

Figura 8-20-DJIA

8.1.3. IBEX 35 El IBEX 35 es el principal índice bursátil de referencia de la bolsa española elaborado por Bolsas y Mercados Españoles (BME). Está formado por las 35 empresas con más liquidez que cotizan en el Sistema de Interconexión Bursátil Electrónico (SIBE) en las cuatro bolsas españolas (Madrid, Barcelona, Bilbao y Valencia). Es un índice ponderado por capitalización bursátil; es decir, al igual que


índices como el Dow Jones, no todas las empresas que lo forman tienen el mismo peso. En la ¡Error! No se encuentra el origen de la referencia. se muestran los valores btenidos al aplicar la red neuronal sobre la semana del 03/04/2017, los datos se muestran en una imagen extraída de la plantilla comparación.xlsx

Figura 8-21-IBEX

En la Figura 8-22 se muestra un resumen de la imagen anterior, en la cual se compara la tendencia prevista y la tendencia real de dicho activo.

03/04/2017

Anterior

Previsión

Real

Valor €

10462.90

10493.98

10529.00

0.33%

ALCISTA

TENDENCIA CORRECTA

Tendencia

ALCISTA

Figura 8-22-IBEX

Error relativo


143

Análisis y resultados

A continuación, los resultados obtenidos para la semana del 10/04/2017, se aprecian en la ¡Error! No se encuentra el origen de la referencia. y la Figura 8-24.

Figura 8-23-IBEX

El resumen se muestra en la Figura 8-24, no coinciden en tendencia la previsión y la real, con un error relativo en el precio final del 2.18%. 24/04/2017 Valor € Tendencia

Anterior

Previsión

Real

Error relativo

10529

10546.46

10326.1

2.13%

ALCISTA

BAJISTA

ERROR TENDENCIA

Figura 8-24-IBEX

Los siguientes resultados son los obtenidos para la semana del 17/04/2017, se muestran en la ¡Error! No se encuentra el origen de la referencia. y la Figura 8-26.


Figura 8-25-IBEX

En la semana del 17/04/2017 se predice la tendencia correcta, siendo el error relativo del 0.33%. 03/04/2017

Anterior

Previsión

Valor €

10326.1

10379.24

10377

0.02%

ALCISTA

ALCISTA

TENDENCIA CORRECTA

Tendencia

Real

Error relativo

Figura 8-26-IBEX

Las previsiones para la semana del 24/04/2017 se muestran a continuación en la ¡Error! No se encuentra el origen de la referencia. y la Figura 8-28.


145

Análisis y resultados

Figura 8-27-IBEX

Esta es la última semana analizada del IBEX 35, la tendencia prevista coincide con la tendencia final, teniendo un error relativo del 2.13%

24/04/2017

Anterior

Previsión

Real

Valor €

10377.00

10548.06

10783.10

2.13%

ALCISTA

TENDENCIA CORRECTA

Tendencia

ALCISTA

Error relativo

Figura 8-28-IBEX

Una vez analizadas cada una de las semanas, en la siguiente figura, se resume el mes completo analizado, con un 75% de acierto en las previsiones y una ganancia porcentual estimada del 4.70% mensual, el equivalente a un 56.4% anual.

03/04/2017 10/04/2017 17/04/2017 24/04/2017

Previsión ALCISTA ALCISTA ALCISTA ALCISTA

Real ALCISTA BAJISTA ALCISTA ALCISTA

Ganancias/Pérdidas 2.41% -1.97% 0.49% 3.77%


TOTAL

4.70%

Figura 8-29-IBEX

La Figura 8-30 muestra la evolución de la cotización del IBEX 35 durante el primer cuatrimestre de 2017, siendo la zona amarilla la analizada. La corrección producida en la semana del 17/04/2017 es predicha correctamente, aspecto muy importante a la hora de operar en los mercados financieros.

Figura 8-30-IBEX

8.1.4. NASDAQ Nasdaq 100 es un índice bursátil de Estados Unidos que recoge a los 100 valores de las compañías más importantes del sector de la industria incluyendo empresas de hardware y de software, las telecomunicaciones, venta al comercio al por menor/por mayor y biotecnología inscritos en la Bolsa de Nueva York (NYSE),


147

Análisis y resultados

listadas en el Nasdaq Stock Market. En el índice pueden estar tanto empresas americanas como internacionales. En la Figura 8-31 se muestran los valores obtenidos al aplicar la red neuronal sobre la semana del 03/04/2017, los datos se muestran en una imagen extraída de la plantilla comparación.xlsx

Figura 8-31-NASDAQ

En la Figura 8-32 se muestra un resumen de la imagen anterior, en la cual se compara la tendencia prevista y la tendencia real de dicho activo. 03/04/2017

Anterior

Previsión

Real

Valor $

5911.74

5747.49

5877.81

2.22%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Error relativo

Figura 8-32-NASDAQ

A continuación, los resultados obtenidos para la semana del 10/04/2017, se aprecian en la Figura 8-33 y la Figura 8-34.


Figura 8-33-NASDAQ

En la semana del 10/04/2017, la previsión y la tendencia real coinciden, siendo bajistas, el valor previsto y el real distan de un 0.52% de error relativo.

10/04/2017

Anterior

Previsión

Real

Valor $

5877.81

5835.15

5805.15

0.52%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Error relativo

Figura 8-34-NASDAQ

Los siguientes resultados son los obtenidos para la semana del 17/04/2017, se muestran en la Figura 8-35 y la Figura 8-36.


149

Análisis y resultados

Figura 8-35-NASDAQ

La tendencia bajista prevista no coincide con la tendencia real alcista, siendo el error relativo entre la previsión y el valor real de la cotización a final de semana del 2.55%.

17/04/2017

Anterior

Previsión

Real

Error relativo

Valor $

5805.15

5759.71

5910.52

2.55%

BAJISTA

ALCISTA

ERROR TENDENCIA

Tendencia

Figura 8-36-NASDAQ

Las previsiones para la semana del 24/04/2017 se muestran a continuación en la Figura 8-37 y la Figura 8-38.


Figura 8-37-NASDAQ

La previsión y la tendencia real no coinciden, siendo la real alcista, con un error relativo entre las cotizaciones del 2.66%.

24/04/2017

Anterior

Previsión

Real

Error relativo

Valor $

5910.52

5865.37

6025.49

2.66%

BAJISTA

ALCISTA

ERROR TENDENCIA

Tendencia

Figura 8-38-NASDAQ

A modo de resumen final, se condensan los resultados obtenidos en las cuatro semanas analizadas, se muestra en la Figura 8-39, siendo las pérdidas porcentuales totales del -1.86%.

03/04/2017 10/04/2017 17/04/2017 24/04/2017

Previsión BAJISTA BAJISTA BAJISTA ALCISTA

Real BAJISTA BAJISTA BAJISTA BAJISTA TOTAL

Ganancias/Pérdidas 0.58% 1.25% -1.78% -1.91% -1.86%


151

Análisis y resultados

Figura 8-39-NASDAQ

La primera semana analizada es claramente el inicio de una corrección alcista, este cambio es predicho por la red neuronal. Es un aspecto muy importante a tener en cuenta, el cambio de las subtendencias.

Figura 8-40-NASDAQ

8.1.5. NIKKEI 225 Comúnmente denominado índice Nikkei, es el índice bursátil más popular del mercado japonés, lo componen los 225 valores más líquidos que cotizan en la Bolsa de Tokio. Desde 1971, lo calcula el periódico Nihon Keizai Shinbun (Diario Japonés de los Negocios), de cuyas iniciales proviene el nombre del índice. Estos valores se caracterizan por su elevada liquidez. Tiene su base 100 el 16 de mayo de 1949. Alcanzó un máximo de 38.957,44 el 29 de diciembre de 1989.


Los valores del índice Nikkei ponderan por precios y no por capitalización, aunque este cálculo difiere de una media simple ya que el divisor es ajustado. En la Figura 8-41 se muestran los valores obtenidos al aplicar la red neuronal sobre la semana del 03/04/2017, los datos se muestran en una imagen extraída de la plantilla comparación.xlsx

Figura 8-41-NIKKEI

En la Figura 8-42 se muestra un resumen de la imagen anterior, en la cual se compara la tendencia prevista y la tendencia real de dicho activo.

03/04/2017 Valor ¥ Tendencia

Anterior

Previsión

Real

18909.2598

18791.5823

18664.6309

0.68%

BAJISTA

TENDENCIA CORRECTA

BAJISTA

Error relativo

Figura 8-42-NIKKEI

A continuación, los resultados obtenidos para la semana del 10/04/2017, se aprecian en la Figura 8-43 y la Figura 8-44.


153

Análisis y resultados

Figura 8-43-NIKKEI

En la Figura 8-44 se muestra el esquema observado en la imagen anterior, no hay concordancia entre la tendencia prevista y la tendencia real, el error relativo cometido entre las cotizaciones prevista y real es del 2.04%.

10/04/2017 Valor ¥ Tendencia

Anterior

Previsión

Real

Error relativo

18664.6309

18709.767

18335.6309

2.04%

ALCISTA

BAJISTA

ERROR TENDENCIA

Figura 8-44-NIKKEI

Los siguientes resultados son los obtenidos para la semana del 17/04/2017, se muestran en la Figura 8-45 y la Figura 8-46.


Figura 8-45-NIKKEI

La tendencia se predice correctamente en la semana del 17/04/2017, siendo alcista, con un error relativo entre el valor previsto y el real del 1.26%.

17/04/2017 Valor ¥ Tendencia

Anterior

Previsión

Real

18335.6309

18386.0986

18620.75

1.26%

ALCISTA

TENDENCIA CORRECTA

ALCISTA

Error relativo

Figura 8-46-NIKKEI Las previsiones para la semana del 24/04/2017 se muestran a continuación en la Figura 8-47 y la Figura 8-48.


155

Análisis y resultados

Figura 8-47-NIKKEI

En esta última semana analizada del Índice Nikkei, coinciden la previsión con la tendencia real, siendo el error relativo del 3.50%.

24/04/2017

Anterior

Previsión

Real

Valor ¥

18620.75

18614.7151

19289.4297

3.29%

ALCISTA

TENDENCIA CORRECTA

Tendencia

ALCISTA

Error relativo

Figura 8-48-NIKKEI

03/04/2017 10/04/2017 17/04/2017 24/04/2017

Previsión BAJISTA ALCISTA ALCISTA BAJISTA

Real BAJISTA BAJISTA ALCISTA ALCISTA TOTAL

Ganancias/Pérdidas 1.31% -1.79% 1.53% 3.47% 4.52%

Figura 8-49-NIKKEI

En la Figura 8-50, se observa un gran cambio de tendencia ocurrido en la tercera


semana analizada, este cambio es predicho por la red (aspecto muy importante a tener en cuenta).

Figura 8-50-NIKKEI

8.1.6. S&P 500 El índice Standard & Poor's 500 (Standard & Poor's 500 Index) también conocido como S&P 500 es uno de los índices bursátiles más importantes de Estados Unidos y del Mundo. Al S&P 500 se lo considera el índice más representativo de la situación real del mercado. El índice se basa en la capitalización bursátil de 500 grandes empresas que poseen acciones que cotizan en las bolsas NYSE o NASDAQ. Los componentes del índice S&P 500 y su ponderación son determinados por S&P y Dow Jones Índices. Se diferencia de otros índices de mercados financieros de Estados Unidos, tales como el Dow Jones Industrial Average o el índice Nasdaq Composite, en la diversidad de los rubros que lo conforman y en su metodología de ponderación. Es uno de los


157

Análisis y resultados

índices de valores más seguidos, y muchas personas lo consideran el más representativo del mercado de acciones de Estados Unidos, y el marcador de tendencias de la economía norteamericana. El National Bureau of Economic Research ha clasificado a las acciones comunes como un indicador relevante de los ciclos de negocios. En la Figura 8-51 se muestran los valores obtenidos al aplicar la red neuronal sobre la semana del 03/04/2017, los datos se muestran en una imagen extraída de la plantilla comparación.xlsx

Figura 8-51-S&P500

En la Figura 8-52 se muestra un resumen de la imagen anterior, en la cual se compara la tendencia prevista y la tendencia real de dicho activo.

03/04/2017

Anterior

Previsión

Real

Valor $

2362.72

2335.18

2355.54

0.86%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Figura 8-52-S&P500

Error relativo


A continuación, los resultados obtenidos para la semana del 10/04/2017, se aprecian en la Figura 8-53 y la Figura 8-54.

Figura 8-53-S&P500

La segunda semana de las cuatro que se analizan coinciden la tendencia prevista y la tendencia real, siendo bajista y con un error relativo en las cotizaciones del 0.24%.

10/04/2017

Anterior

Previsión

Real

Valor $

2355.54

2334.62

2328.95

0.24%

BAJISTA

TENDENCIA CORRECTA

Tendencia

BAJISTA

Error relativo

Figura 8-54-S&P500

Los siguientes resultados son los obtenidos para la semana del 17/04/2017, se muestran en la Figura 8-55 y la Figura 8-56.


159

Análisis y resultados

Figura 8-55-S&P500

En la semana que se resume en la Figura 8-56, las tendencias no coinciden, siendo al real alcista y la prevista en sentido contrario, el error relativo es del 1.50%.

17/04/2017

Anterior

Previsión

Real

Error relativo

Valor $

2328.95

2313.47

2348.69

1.50%

BAJISTA

ALCISTA

ERROR TENDENCIA

Tendencia

Figura 8-56-S&P500

Las previsiones para la semana del 24/04/2017 se muestran a continuación en la Figura 8-57 y la Figura 8-58.


Figura 8-57-S&P500

La tendencia prevista no coincide con la real en la semana del 24/04/2017, siendo la tendencia real alcista, y el error relativo del 2.38%.

24/04/2017 Valor $

Anterior 2348.69

Previsión 2330.61

Real 2387.45

Tendencia

BAJISTA

BAJISTA

ALCISTA

Error relativo 2.38% ERROR TENDENCIA

Figura 8-58-S&P500

En la Figura 8-59 se muestra el resumen para el índice S&P 500, de las cuatro semanas analizadas, el porcentaje de aciertos es del 50%, siendo el balance global negativo, del -1.02% mensual, el equivalente al -12.24% anual.

03/04/2017 10/04/2017 17/04/2017 24/04/2017

Previsión BAJISTA BAJISTA BAJISTA BAJISTA

Real BAJISTA BAJISTA ALCISTA ALCISTA TOTAL

Figura 8-59-S&P500

Ganancias/Pérdidas 0.30% 1.14% -0.84% -1.62% -1.02%


161

Análisis y resultados

Se puede observar como la primera semana analizada es un cambio de tendencia (si la tendencia se expresa semanalmente) y la red es capaz de predecir dicho cambio.

Figura 8-60-S&P500

8.2. Análisis Global A continuación se analiza el resultado global de aplicar el algoritmo durante 4 semanas a los principales índices, cabe destacar la presencia de un GAP en todos los índices analizados durante la última semana de ejecución. En la Figura 8-61 se muestra un resumen de las pruebas realizadas con los diferentes índices, se muestra el acierto/fallo en la tendencia, así como el error relativo de la cotización prevista y la cotización real. El porcentaje de acierto respecto a la tendencia ha sido de un 66.6%, siendo 75% el máximo y 50% el mínimo. El porcentaje de beneficios globales asciende al 0.79% mensual, extrapolando a un año sería 9.48% anual de rentabilidad. Los datos son calculados


suponiendo una cartera equitativa entre todos los índices analizados, con apertura de operaciones a inicio de semana y cierre al final de dicha semana. Cabe destacar que según la política de trading mencionada en el párrafo anterior, el inversor estaría el 100% del tiempo en el mercado, ya sea con previsiones alcistas o bajistas, intentando seguir las tendencias semanales.

DAX 30 Tendencia 03/04/2017 10/04/2017 17/04/2017 24/04/2017

TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA ERRÓNEA

% ACIERTO

DJIA Error Relativo 1.68% 0.72% 0.67% 3.89% 75%

Tendencia TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA ERRÓNEA TENDENCIA CORRECTA

% ACIERTO

IBEX 35 Tendencia 03/04/2017 10/04/2017 17/04/2017 24/04/2017

TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA ERRÓNEA

% ACIERTO

NIKKEI 225 Tendencia 03/04/2017 10/04/2017 17/04/2017 24/04/2017

TENDENCIA CORRECTA TENDENCIA ERRÓNEA TENDENCIA CORRECTA TENDENCIA CORRECTA

% ACIERTO

NASDAQ Tendencia

Error Relativo 0.02% 2.18% 0.33% 2.13% 75%

TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA ERRÓNEA TENDENCIA ERRÓNEA

% ACIERTO

Error Relativo 0.89% 0.02% 0.88% 1.70% 75%

Error Relativo 2.22% 0.52% 2.55% 2.66% 50%

S&P 500 Error Relativo 0.68% 2.04% 1.26% 3.50% 75%

Tendencia TENDENCIA CORRECTA TENDENCIA CORRECTA TENDENCIA ERRÓNEA TENDENCIA ERRÓNEA

% ACIERTO

Error Relativo 0.86% 0.24% 1.50% 2.38% 50%

Figura 8-61-Análisis global

Según el análisis visto anteriormente, los valores con mayor porcentaje de previsión (75%) son: DAX, DJIA, IBEX y NIKKEI. Los valores con menor porcentaje (50%) son: NASDAQ y S&P 500. El mayor beneficio se produce en la última semana del NIKKEI 225 con un 3.5% de beneficios semanal, el equivalente al 175% anual. La mayor pérdida se produce en la última semana del DAX 30 con un valor del -3.86% semanal, el equivalente al -


163

Análisis y resultados

193% anual. Como se ha visto en el apartado anterior, en la última semana analizada hubo un GAP generalizado en todos los Índices mundiales, un elemento impredecible por cualquier sistema que se precie, por lo tanto los datos globales pueden estar algo distorsionados. Cabe destacar que la red neuronal diseñada predice no sólo la continuación de tendencias, si no que predice los cambios en las tendencias, que es lo realmente interesante en este proyecto. El tiempo medio para cada previsión semanal es de 55 segundos. Tiempo razonable, ya que son previsiones con horizonte semanal. En la Figura 8-62-Evolución cartera se muestra la supuesta evolución de una inversión de 10.000 euros para dichas cuatro semanas de análisis anterior.

10,100.00 €

10,089.17 €

10,079.17 €

10,080.00 € 10,060.00 € 10,040.00 €

10,047.00 € 10,037.67 €

10,020.00 € 10,000.00 € 10,000.00 € 9,980.00 € 9,960.00 € 9,940.00 € CAPITAL INICIAL

Semana 1

Semana 2

Se m a n a 3

Figura 8-62-Evolución cartera

Se m a n a 4


9. CONCLUSIONES "Cada fracaso enseña al hombre algo que necesitaba aprender" - Charles Dickens-

Este proyecto ha analizado las Redes Neuronales Artificiales tipo perceptrón multicapa para modelar el comportamiento no lineal y difuso que poseen los mercados financieros. Como parámetros de entrada (timeframe semanal) se han utilizado cinco: 

Precio apertura.

Volumen.

MACD.

Diferencia MACD y su media.

RSI.

Y el parámetro de salida ha sido el precio de cierre de dicha semana, con el que se deduce la tendencia semanal (alcista o bajista). Dicho algoritmo se ha ejecutado en el mercado en vivo sobre índices mundiales, ya que son más técnicos que valores individuales por separado. Los índices elegidos han sido los siguientes: DAX 30, DOW JONES, IBEX 35, NASDAQ, NIKKEI 225 y S&P 500. Como bien se sabe, a la hora de abrir y cerrar una posición en los mercados financieros, y más aún en el medio plazo, lo importante es seguir las tendencias del mercado. Las tendencias se pueden apreciar en el mismo gráfico de la cotización añadiendo una simple media, por lo tanto, el objetivo perseguido ha sido el de encontrar cambios de tendencia o su continuación.


Conclusiones

165

Se consigue un porcentaje de acierto del 66.6% sobre la tendencia en semanal, aún así a la hora de realizar entradas y salidas del mercado se debe complementar con otros análisis y factores como cambios de tendencia de las medias móviles o divergencias en el MACD, a priori, fuera del alcance de las redes neuronales. El porcentaje de beneficios globales asciende al 0.79% mensual, extrapolando a un año sería 9.48% anual de rentabilidad. Los datos son calculados suponiendo una cartera equitativa entre todos los índices analizados, con apertura de operaciones a inicio de semana y cierre al final de dicha semana. Una mejora podría considerar la modificación de los datos de entrada (número de entradas y tipos), su longitud temporal, así como la optimización de los parámetros propios de la red neuronal (% de entrenamiento, validación y test). Existen muchas combinaciones en este sentido, siendo un campo de máxima importancia a nivel mundial. Hacer mención a nuevas líneas de aplicación como son el trading de alta frecuencia (timeframe en ticks), dichos algoritmos son estudiados por grandes entidades para sus operaciones intradiarias. En los que se ha de sincronizar la información instantáneamente entre MATLAB® y el servidor de datos.


REFERENCIAS

[1] ALFAYATE GALLARDO, Javier. Aleta de Tiburón,» Tesis Doctoral, vol. 2, nº 13, 2012. [2] WEINSTEIN, Stan. Los secretos para ganar dinero en los mercados alcistas y bajistas. Ed. Gestión Moderna de Valores, 1998. 334p. ISBN: 9788486900083. [3] ELDER, Alexander. Vivir del trading. A Coruña; Netbiblo, 2004. 335p. ISBN: 978-84-974-5079-9 [4] KOSTOLANY, André. El fabuloso mundo del dinero y la bolsa. Planeta, 1987. 271p. ISBN: 9788432078743. [5] NISSON, Steve. Más allá de las Velas. Madrid. Gesmovasa, 1996. 255p. ISBN: 978-84-869-0015-1. [6] HAGAN, M.T., DEMUTH, H.B. Neural Network Design. 2nd Edition. eBook. pp. 889-972. [7] PEREZ VALLS, Jesús. Herramienta MATLAB para la selección de entradas y predicción neuronal de valores de bolsa.Departamento de Ingeniería de Sistemas y Automática Escuela Superior de Ingenieros de Sevilla, 2013. [8] Yahoo! Inc. © 2017. Disponible en: es.finance.yahoo.com/echarts?s=%5EDJI [9] The MathWorks, Inc. http://www.es.mathworks.com/

©

1994-2017.

Disponible

en:


Referencias

167



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.