Motivación

Page 1

Capítulo uno Introducción Motivación: ¿Por qué Pensar en Redes Neuronales Artificiales? La necesidad del conocimiento y aplicación de las redes neuronales, está generada por el acelerado rumbo que toman los nuevos y cada vez más sofisticados sistemas de desarrollo basados en Inteligencia Artificial. Uno de los elementos que nos llevaría a disminuir la brecha entre tales avances sería el inicio de la socialización del conocimiento que nos inicie a la adquisición y al buen manejo de los mismos para dar solución a los problemas reales de nuestro entorno. El enfoque de este conocimiento varía de acuerdo a los problemas que se pretende resolver, pero las bases son las mismas, por lo tanto resulta muy útil para un investigador que proyecte dar solución a un problema específico en cualquier rama del conocimiento.

Bases del conocimiento El objetivo más fuerte de la informática es el de tratar la información de una forma inteligente. Controlar los sistemas de una mejor forma. Cuando se trabaja con control por computador, sea cual sea la metodología empleada, por lo general, la finalidad es que los programas manejen instrucciones, la(s) cuales deben cumplir y lo que pretende la programación párlela es tomar decisiones sobre la información que trata el programa, sobre los sistemas que controla. Siempre se ha aprendido que el ordenador es una máquina tonta, que solamente hace lo que se le ordena, y nuestro fin es que parezca inteligente en sus decisiones y el fin sería que realmente fueran inteligentes.

¿Que se Entiende por Inteligencia Artificial? Esta respuesta sigue siendo discutida por los expertos y sin lugar a dudas la definición que aquí se presenta es más bien simplista a fin de contextualizar las redes neuronales. Un sistema se considera como “inteligente”, según como sea su respuesta ante nuevos estímulos. Cuando un programa da una buena respuesta ante un dato de entrada esperado, no consideramos que el programa sea inteligente, sino que es inteligente el programador que lo hizo.


REDES NEURONALES ARTIFICIALES Sin embargo, existen muchas aplicaciones en las cuales el programador no puede abarcar el dominio del problema, ya sea porque es excesivamente complejo o bien sea por que es desconocido. Es justo aquí en este punto en donde se pide al algoritmo que sea inteligente, es decir que la respuesta ante nuevas y desconocidas entradas, en las cuales el programador ni siquiera pensó, sea coherente con lo que el programa ha de responder. Se debe observar que aquí se engloban muchos problemas, que habitualmente se consideran de inteligencia artificial, como son los sistemas expertos, pero también otros que, aunque directamente no parecen estar relacionados con la inteligencia artificial, bien hacen parte de ella cuando se trabaja con técnicas avanzadas de programación para su solución. Como es el caso del control por computador, de la percepción e identificación de imágenes, de la optimización de sistemas entre otros. Tradicionalmente la informática ha ofrecido dos enfoques al problema de la inteligencia artificial, como son El conexioncita y El simbólico. En Los Modelos Simbólicos, se plantea la realidad como un conjunto de reglas y unas operaciones que pueden ser aplicadas sobre las reglas. Para aprender, se buscan nuevas reglas, y de igual forma se buscan nuevas propiedades de las reglas ya existentes. Es el caso de las lógicas-modales, de primer orden, predicados, etc. Los modelos simbólicos tienen grandes ventajas. Son muy intuitivos, claros y, primero la filosofía y después la matemática, se ha trabajado mucho en ellos, pero persiste el problema de la explosión combinatoria de los métodos de deducción. Los Modelos Conexionistas, están basados en un enfoque completamente distinto. No se buscan reglas, ya que tal vez ni existan, no se busca plantear métodos para deducir nuevas reglas, ya que son excesivamente complejas, no se va a modelar un sistema, éste se va a modelar solo. La pregunta es: entonces ¿qué es lo que se hace?, se plantea una RED NEURONAL ARTIFICIAL, consistente de muchos elementos primarios, llamados NEURONAS, que realizan funciones sencillas, que pueden ser lineales o no lineales.[Santo] Las redes neuronales son las implementaciones de Software y/o Hardware de modelos matemáticos basados en el funcionamiento ideal de los sistemas neuronales biológicos. La potencialidad de estas redes es que se puede variar las características de las mimas, que me definen del tipo de interconexión de estos elementos básicos o neuronas. El valor de salida de un elemento va a ser función también de los valores de salida de los otros elementos, que llegan por las interconexiones. La preocupación, será fundamentalmente definir:

Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES • • • •

La topología de la red, lo que define que neuronas se conectarán con otras y que tipo de conexión se usará. Se elige el mecanismo que se empleará para ajustar los pesos, es decir la importancia relativa de las interconexiones entre los nodos. Como se inicializará la red, aquí se definen los valores de entrada y la manera de asignar los pesos iniciales de las interconexiones. Cómo evoluciona la red. Se define que función utilizará cada neurona y si el cálculo de los datos se hará neurona por neurona y en que orden o si se realizará de forma simultánea. La condición de parada de la red. Es decir cuando podemos asegurar que la salida dela red es realmente una solución al problema.

Cada una de las posibles soluciones a las preguntas anteriores resulta ser el planteamiento de un problema mediante el modelo conexionista. Existen muchos investigadores que consideran que todos los modelos conexionistas son redes neuronales y otro grupo que no clasifican algunos modelos conexionista dentro de las redes neuronales. Lo que está claro es que todas las redes neuronales son modelos conexionistas. El mecanismo de resolución de un problema con una red neuronal es, en consecuencia, decidir el modelos, pasar los parámetros de entrada citados anteriormente y la red aprenderá y nos dará como salida la solución del problema, habitualmente se cuenta con un conjunto de entradas validas (conocido como conjunto de validación), con las que probamos o validamos si la red aprendió, si logra aprender, que es un proceso computacionalmete pesado, ya estará lista para generar salidas validas en un tiempo mínimo: de no ser así se ejecutan los acondicionamientos de los pesos y se vuelve a entrenar; todo esto explicado de una manera muy superficial. Es importante observar que mientras que en el modelo, el mecanismo de resolución es independiente de la naturaleza del problema pueden construirse motores que hagan el trabajo pesado, en un modelo conexionista es preciso plantearse exactamente que tipo de red neuronal va a ser la más adecuada. Un error en la elección puede dar como resultado, una demora en hallar la solución, o que no la alcance nunca. Sin embargo mientras que en un modelo simbólico, una pequeña variación de los datos de entrada hace que el problema se tenga que comenzar de nuevo desde cero, en un modelo conexionista una vez elegida y verificada la topología, además con la red entrenada los cálculos posteriores serán realizados a gran velocidad. Las redes neuronales son un paradigma de computación del que día a día se están encontrando nuevas aplicaciones gracias a la gran cantidad de ventajas que poseen, entre la que podemos citar las siguientes.

Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES •

• •

Paralelismo. Dada la naturaleza intrínsecamente paralela del algoritmo es muy fácil encontrar una solución a un problema. Es importante resaltar que los cálculos son siempre locales que son transmitidos de neurona a neurona. No linealidad. Podemos resolver problemas con un alto grado de no linealidad casi con la misma facilidad que se resuelve un problema lineal. Es factible aumentar el grado de no linealidad del problema, así como los parámetros de entrada, y aunque esto desencadene un aumentos exponencial en la complejidad del problema, aún resulta fácil de manejar. [Olivero 2001] Tolerancia a fallos. En caso de fallo de una neurona o conexión, la solución no será afectada, por que la red neuronal almacena la información de forma holística, es decir, que toda la información está almacenada en toda la red no existiendo un único punto de localización de la información, factor fundamental para los sistemas de control, haciéndolas altamente competitivas. Adaptabilidad. Ante cambios en su entorno las redes neuronales alteran su comportamiento. Esto permite a muchos modelos aprender sobre la marcha (In Line) o incluso, si evoluciona la naturaleza del problema y las soluciones válidas, también evoluciona la red para continuar generando salidas válidas. Respuesta Evidencial. Muchos modelos además de dar una salida, suministran el grado de certidumbre que tiene la red en la salida presentada. Admite implementación en circuitos VLSI. Excelentes resultados para algunos casos en que no se conoce a priori la solución del problema. Las redes neuronales presenta resultados impresionantes en el caso de reconocimiento de patrones, cuando ni siquiera conocemos la estructura de las clases (la interpolación de funciones), cuando muchas veces no es conocida la ecuación de la función y la optimización de la misma cuando esta presenta gran cantidad de mínimos locales. Hay otros problemas para los que las redes neuronales presentan excelentes resultados como es el caso de control de un sistema, identificación de sistemas de control, toma de decisiones etc.

Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES

Un poco de historia de las Redes Neuronales Artificiales Para ahondar en el proceso del nacimiento y evolución de las redes neuronales, se presenta el siguiente resumen. Las redes neuronales artificiales basan su funcionamiento en las redes neuronales de tipo biológico, estando formadas por un conjunto de unidades de procesamiento conectadas entre sí. Por analogía con el cerebro humano se denomina «neurona» a cada una de estas unidades de procesamiento. Cada neurona recibe muchas señales de entrada y envía una única señal de salida (como ocurre en las neuronas biológicas) [Freeman 91], [Mc.Cord 91], [Fausett 94]. En 1943 Warren McCulloch y Walter Pitts propusieron el modelo clásico de neurona artificial en el que se basan las redes neuronales actuales. Seis años después, en 1949, en su libro "The Organization of Behavior", Donald Hebb presentaba su conocida regla de aprendizaje (Aprendizaje Hebbiano) [LiMin 94]. En 1957, Frank Rosenblatt presentó el Perceptrón, una red neuronal con aprendizaje supervisado cuya regla de aprendizaje era una modificación de la propuesta por Hebb. El Perceptrón trabaja con patrones de entrada binarios, y su funcionamiento, por tratarse de una red supervisada, se realiza en dos fases: una primera en la que se presentan las entradas y las salidas deseadas; en esta fase la red aprende la salida que debe dar para cada entrada. La principal contribución del Perceptrón consistió en que la adaptación de los pesos se realiza teniendo en cuenta el error calculado entre la salida que da la red y la salida que se desea. En la fase siguiente, de operación, la red «es capaz» de responder adecuadamente cuando se le vuelven a presentar los patrones de entrada. Se crearon grandes expectativas sobre sus aplicaciones, pero posteriormente se tornaron en gran decepción cuando en 1969 Minsky y Papert presentaron un perspicaz y detallado análisis del Perceptrón, en términos de sus capacidades y limitaciones, quedando con esto claro que existían ciertas restricciones para la clase de problemas para los cuales era adecuado el Perceptrón. Los Perceptores sólo pueden distinguir tramas sí las tramas son linealmente separables. Dado que hay muchos problemas que son linealmente no separables, ésta condición impone unos paramentos bastantes restrictivos a la aplicabilidad del Perceptrón [Minsky 69]. En los años 60 se propusieron otros dos modelos, también supervisados, basados en el Perceptrón de Rosenblatt denominados Adaline y Madaline. En estos, la adaptación de los pesos se realiza teniendo en cuenta el error, calculado como la diferencia entre la salida deseada y la dada por la red, al igual que en el Perceptrón. Sin embargo, la regla de aprendizaje empleada es distinta. Se define una función error para cada neurona que da cuenta del error Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES cometido para cada valor posible de los pesos cuando se presenta una entrada a la neurona. Así, la regla de aprendizaje hace que la variación de los pesos se produzca en la dirección y sentido contrario del vector gradiente del error. Esta regla de aprendizaje se denomina Delta [Lippmann 87]. La era moderna de las redes neuronales artificiales surge con la técnica de aprendizaje de propagación hacia atrás o "Back Propagation". La estructura de las redes citadas anteriormente (Perceptron, Adaline y Madaline) consta de dos capas: una primera capa formada por unidades que dejan pasar la entrada y que No tienen aprendizaje, y una segunda capa formada por una neurona (o varias para el caso del Madaline). Debido a que la contribución de Minsky y Papert fue la de demostrar que una red del tipo Perceptrón no era capaz de aprender todas las posibles combinaciones entre entradas y salidas. Se planteó dar solución al problema añadiendo capas intermedias de neuronas, introduciendo de esta forma el problema de cómo enseñar a estas capas intermedias, tomando aquí importancia el algoritmo de propagación hacia atrás. En éste se compara la salida real con la salida deseada. La diferencia entre estas constituye un error que se propaga hacia atrás desde la capa de salida hasta la de entrada permitiendo así la adaptación de los pesos de las neuronas intermedias mediante una regla de aprendizaje Delta, sin embargo, esta regla también tiene sus limitaciones [Widrow 60] La red Hopfield es muy importante, por razones históricas. El trabajo de Jhon Hopfield fue el trabajo que dio credibilidad a las redes neuronales en el año 1982, trayendo a la luz el hecho de cómo simples componentes de redes inspirados biológicamente por una neurona pudieran ser usados con propósitos computacionales. Posteriormente se han desarrollado otros modelos que permiten un aprendizaje no supervisado como el mapa auto-organizativo de Kohonen, los basados en la Teoría de Resonancia Adaptativa (ART) de Grossberg y Carpenter, ó los modelos de control motor de Bullock, Gaudiano y Grossberg, entre otros.

Algunas aplicaciones Tecnológicas de las RNA

Clasificación de señales de radar y sonar. Las redes neuronales pueden distinguir entre diferentes tipos de señales que retornan al radar con mayor precisión que los sistemas convencionales [Haykin 91] Una red neuronal puede ser entrenada para distinguir entere señales de retorno de una roca y la de un cilindro de acero [Gorman 88]

Conversión de texto escrito en hablado. El programa NETTALK es una red neuronal que fue entrenada para leer un texto y convertirlo en habla [Sejnowski 87]

Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES •

Aplicaciones médicas. Las redes neuronales son halladas en muchos usos referentes a clasificación y diagnóstico en aplicaciones médicas. Un ejemplo es una red neuronal que usa datos de imágenes para clasificar reacciones de la sangre frente a anticuerpos [Donlin 92]

Aplicaciones bancarias. Los bancos han encontrado múltiples usos en las redes neuronales. Estudio para el otorgamiento de préstamos, es ahora protegido por sistemas basados en redes neuronales para determinar riegos en los créditos. Las redes neuronales están siendo usadas para detectar patrones anómalos en el uso de las tarjetas de crédito que pueden indicar que la tarjeta ha sido robada. Algunos puntos de venta se están protegiendo, incorporando redes neuronales para determinar si un cheque es falso (AVCO, Financial Service en California usa este sistema)[Pollac 87].

Otros campos, como la predicción económica y problemas de gestión, aprendizaje preventivo, etc. II)

Aplicaciones al Control Automático:

Visión artificial: Se emplean modelos de redes neuronales que son capaces de emular características del funcionamiento visual humano permitiendo, por ejemplo, el reconocimiento de imágenes con textura en color, el aprendizaje para determinar posiciones a partir de la información proveniente de dos cámaras, y representación de la visión binocular.

Reconocimiento y categorización de patrones: Estas redes emplean la arquitectura de la Teoría de la Resonancia Adaptativa o ART. Entre otras aplicaciones se encuentran el reconocimiento de caracteres manuscritos y clasificación de cromosomas.

Procesos químicos: entre las aplicaciones en esta área podemos mencionar a manera de ejemplo: El control de temperatura en un reactor químico y el control de procesos químico-orgánicos no lineales.

Control de cinemáticas (motor): Permiten resolver el problema cinemático inverso en manipuladores y robótica móvil, consistente en determinar la secuencia de movimientos que deben realizar las distintas partes del robot para alcanzar una posición deseada. También permiten el aprendizaje de la dinámica del manipulador, es decir, de la generación de las fuerzas y pares que hay que aplicar para producir un movimiento determinado.

Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES

III)

Aplicaciones de Reconocimiento de Patrones.

Reconocimiento de caracteres, donde el objeto a clasificar son los miembros de un alfabeto dado.

Clasificación de huellas digitales

Identificación de recursos naturales basado en fotografías tomadas por satélites.

Análisis clínicos en donde los tipos de clasificación pueden ser sano, normal, deficiente o indeterminado.

Control de calidad tanto de materiales y máquinas como de procesos de fabricación. Reconocimiento auditivo de patrones, incluyendo la identificación de la palabra, identificación del orador, etc.

Aplicaciones de ingeniería tales como identificación del tipo de aviones, con base a las señales emitidas por el radar, la selección de diversos tipos de producción, etc.

En el campo de la medicina tiene muchas aplicaciones en lo que a clasificación de análisis se refiere y cualquier tipo de test que no tenga respuesta exacta en el diagnóstico.

Aplicaciones macro-económicas, por ejemplo predecir el grado de inflación de un país para el siguiente periodo estacional basado en series económicas de tiempo.

Aplicaciones meteorológicas: consisten básicamente en estratificar los tipos o clases de situaciones meteorológicas diarias en una región determinada para así poder predecir las más probables [Escudero 77].

Este recorrido que parte de un enfoque de la informática, pasando por la filosofía de la inteligencia artificial para luego aterrizar en las redes neuronales artificiales, y algunas de sus posibles aplicaciones, evidencia el interés que se tiene en el la investigación y desarrollo con redes neuronales. Un área de gran interés se encuentra en el campo de reconocimiento óptico de caracteres (OCR), con la búsqueda de soluciones al reconocimiento de formas (o patrones). Los desarrollos en ésta área con redes neuronales mejoran cada vez, en especial con la utilización de las redes neuronales de alto orden, un tipo

Autora: Stella Judith Olivero Márquez


REDES NEURONALES ARTIFICIALES de red que maneja clasificaciones de tipo no lineal con resultados muy sorprendentes. [Olivero 2001][] Ahora sólo me queda brindarles un espacio para la formación dirigida a la solución de nuestros problemas y nuestras inquietudes en el marco de las Redes Neuronales Artificiales. Por lo tanto la propuesta conlleva a la orientación de cursos en el área de la Inteligencia Artificial, considerando que es un proceso que apenas empieza y que debemos nutrirlo con nuestros aportes y así fortalecer el trabajo de investigación en este área.

Autora: Stella Judith Olivero Márquez


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.