Inteligencia Artificial Gerardo M. Sarria M. Universidad del Valle Agosto 30 de 2006
AGENTES INTELIGENTES
Contenido Agentes y Ambientes Racionalidad Entorno de Trabajo Tipos de Agentes Agentes Reflexivos B´asicos Agentes Reflexivos con Estado Agentes basados en Objetivos Agentes basados en Utilidad Agentes que Aprenden Resumen
Agentes y Ambientes sensores percepciones
? ambiente
agente acciones
actuadores
Agentes incluyen humanos, robots, softbots, termostatos, etc. La funci´on del agente asocia secuencias de percepciones a acciones: f : P∗ → A El programa del agente se ejecuta en una arquitectura f´ısica para producir f
Racionalidad
¿Qu´e hace que un agente sea bueno o malo, inteligente o est´ upido? Medidas de rendimiento fijas evaluan la secuencia de acciones del ambiente Un agente racional escoge qu´e acci´ on maximiza el valor esperado de la medida de rendimiento dada la secuencia de percepciones hasta la fecha
Racionalidad
Racional 6= omnisciencia - Las percepciones pueden no aportar toda la informaci´on relevante Racional 6= clarividente - Las acciones realizadas pueden no ser las esperadas Por lo tanto, racional 6= exitoso Racional ⇒ exploraci´on, aprendizaje, autonom´ıa
Entorno de Trabajo
Para dise˜ nar un agente racional, se debe especificar el entorno de trabajo Considerando, por ejemplo, el dise˜ no de un sistema de diagn´ostico m´edico: ¿Medidas de Rendimiento? pacientes sanos, reducir los costos, demandas, . . . ¿Entorno? hospital, cl´ınica, doctores, enfermeras, pacientes, . . . ¿Actuadores? preguntas, pruebas, diagn´ osticos, tratamientos, casos, . . . ¿Sensores? c´amara, teclado, repuestas del paciente, temperatura, presi´on, . . .
Tipos de Entorno
Crucigrama ¿Observable? ¿Determin´ıstico? ¿Epis´ odico? ¿Est´ atico? ¿Discreto? ¿Agente Simple?
S´ı S´ı No S´ı S´ı S´ı
Analizador de im´ agenes S´ı S´ı S´ı Semi No S´ı
Tutor de ingl´es Parcial No No No S´ı No
Taxi autom´ atico Parcial No No No No No
El tipo de entorno determina en gran medida el dise˜ no del agente El mundo real es (por supuesto) parcialmente observable, estoc´astico, secuencial, din´amico, continuo y multi-agente
Tipos de Agentes
Cuatro tipos b´asicos en orden de generalidad: I
Agentes reflexivos simples
I
Agentes reflexivos con estado
I
Agentes basados en objetivos
I
Agentes basados en utilidad
Todos ellos pueden ser transformados en agentes que aprenden
Agentes Reflexivos B´asicos
Agente
Sensores Cómo es el mundo ahora
Ambiente
Reglas de condición-acción
Qué acción debo realizar ahora
Actuadores
Agentes Reflexivos con Estado
Sensores Estado Cómo evoluciona el mundo
Cómo es el mundo ahora
Ambiente
Qué hacen mis acciones
Reglas de condición-acción
Agente
Qué acción debo realizar ahora
Actuadores
Agentes basados en Objetivos
Sensores Estado Cómo es el mundo ahora
Qué hacen mis acciones
Qué pasaría si realizo la acción A
Objetivos
Qué acción debo realizar ahora
Agente
Actuadores
Ambiente
Cómo evoluciona el mundo
Agentes basados en Utilidad
Sensores Estado Cómo es el mundo ahora
Qué hacen mis acciones
Qué pasaría si realizo la acción A
Utilidad
Qué tan contento estaré en este estado
Qué acción debo realizar ahora
Agente
Actuadores
Ambiente
Cómo evoluciona el mundo
Agentes que Aprenden
Rendimiento normal
Cr铆tica
Sensores
retroalimentaci贸n
Elemento de actuaci贸n
de aprendizaje
conocimiento objetivos de aprendizaje
Generador de problemas
Agente
Actuadores
Ambiente
cambios Elemento
Resumen
Los agentes interact´ uan con ambientes mediante actuadores y sensores La funci´on del agente describe qu´e hace el agente en toda circunstancia La medida de rendimiento eval´ ua la secuencia de percepciones Un agente perfectamente racional maximiza el rendimiento esperado
Resumen
Los programas del agente implementan (algunas) funciones del agente Las especificaciones PEAS definen los entornos de trabajo Los ambientes est´an categorizados en muchas dimensiones: ¿observables? ¿deterministicos? ¿epis´ odicos? ¿est´aticos? ¿discretos? ¿agentes-simples? Existen muchas arquitecturas de agentes b´asicos: reflexivos, reflexivos con estado, basados en objetivo, basados en utilidad
Fin de la Presentaci´ on