Qué es Machine Learning? Luis Felipe Giraldo Trujillo Profesor Asistente Departamento de Ingeniería Eléctrica y Electrónica Universidad de los Andes, Colombia
http://wwwprof.uniandes.edu.co/~lf.giraldo404/ lf.giraldo404@uniandes.edu.co
QuĂŠ es Machine Learning?
Data Mining
BĂşsqueda automĂĄtica de patrones en datos para la toma de decisiones
Aplicaciones de Machine Learning
Reconocimiento de voz
Aplicaciones de Machine Learning
Reconocimiento de voz
Análisis de señales biológicas
Interacción humano-máquina
Tratamiento de enfermedades
Aplicaciones de Machine Learning Entendimiento de escenas en imรกgenes/videos
Segmentaciรณn automรกtica
Identificaciรณn de objetos
Aplicaciones de Machine Learning AnĂĄlisis de actividad sĂsmica
Aplicaciones de Machine Learning Secuencias y estructuras
Análisis de texto
Análisis de secuencias genéticas
Aplicaciones de Machine Learning
Predicciones en series de tiempo IrradiaciĂłn solar en sistemas fotovoltaicos Consumo energĂa elĂŠctrica
Aplicaciones de Machine Learning
DetecciĂłn de anomalĂas
QuĂŠ es Machine Learning?
A partir de datos, descubrir patrones para: - Analizar comportamientos - Predecir - Tomar decisiones
QuĂŠ es Machine Learning?
A partir de datos, descubrir patrones para: - Analizar comportamientos - Predecir - Tomar decisiones CĂłmo podemos hacer esto?
Ejercicio 1
Tomado de presentaciรณn por Josh Tenenbaum, MIT
Ejercicio 1
Ejercicio: encontrar las otras ‘tufas’
Tomado de presentación por Josh Tenenbaum, MIT
Ejercicio 1 Información relevante:
- Color del objeto ……… no - Color del fondo ………. no - Geometría …………….. si • Forma de la base • Presencia de un “tallo” • Parte superior prominente
Ejercicio 2 Ya estamos entrenados para reconocer una cara cuando la vemos
Ejercicio 2
Ejercicio: encontrar ilusiones de caras en esta imagen
Ejercicio 2 Información relevante:
-
Colores …………………………. no Identificar dónde hay árboles ... no Presencia de un cuerpo ………. no Estructura ……………………….. si • Presencia de ojos, nariz, y boca en orden particular
Proceso para reconocer patrones En los ejercicios el proceso realizado fue:
DATOS PARA ENTRENAR
EXTRACCION DE INFORMACION RELEVANTE
Aprendizaje
MODELO MENTAL
RECONOCIENTO DE OBJETOS DESCONOCIDOS
Proceso para reconocer patrones
• Los humanos somos muy buenos para aprender y reconocer patrones! • Sin embargo, no tan buenos cuando gran cantidad de información para procesar rápidamente
• Necesidad de realizar este proceso de manera automática
Ejemplo: selecciรณn automรกtica de pescado
Cรกmara
Objetivo: Automatizar proceso de selecciรณn de pescado: Salmรณn / bagre
Banda transportadora
Ejemplo: selecciรณn automรกtica de pescado
Cรกmara
DATOS PARA ENTRENAR
EXTRACCION DE INFORMACION RELEVANTE
MODELO
RECONOCIENTO DE TIPO DE PEZ
Objetivo: Automatizar proceso de selecciรณn de pescado: Salmรณn / bagre
Ejemplo: selecciรณn automรกtica de pescado
Datos para el entrenamiento:
Bagre
Salmรณn
Ejemplo: selección automática de pescado
Qué información es relevante para diferenciar uno del otro?
Bagre
Salmón
- Número de escamas? - Color? - Número de ojos? - Tamaño?
Ejemplo: selección automática de pescado
Qué información es relevante para diferenciar uno del otro?
Bagre
Salmón
- Número de escamas - Color - Número de ojos - Tamaño
Ejemplo: selección automática de pescado
Color x
x
Extracción de información sobre color y tamaño en muchas muestras
x
x x x
x
x
x
x
o x
o
o
o o o o o oo
o
Tamaño
Ejemplo: selección automática de pescado
Color x
x x
Distribución de las muestras exhibe un patrón diferenciador
x x x
x
x
x
x
o x
o
o
o o o o o oo
o
Tamaño
Ejemplo: selección automática de pescado ?
Color x
x x
Dada una nueva muestra con clase de pez desconocida, cómo determinar si es salmón o bagre?
x x x
x
x
x
x x
*
o o
o
o o o o o oo
o
Tamaño
Ejemplo: selección automática de pescado
Una posibilidad: encontrar una función que separa las clases de pez
?
Color x
x x
x x x
x
x
x
x x
*
o o
o o o o o oo
o
Modelo de decisión
Es salmón si está en región roja Es bagre si está en región gris
o
Tamaño
Aprendizaje supervisado ENTRENAMIENTO Datos de entrenamiento
Clase 1 Extracción de información relevante
x Clase 2 x xx xxx x o xx x oo o ooo o ooo
Diseñar modelo de clasificación
?
PRUEBA Dato desconocido
* Extracción de información relevante
Modelo ya entrenado
Etiqueta
Aprendizaje supervisado
x
x
Cรณmo encontrar el clasificador?
x
x x x
x
x
x
x
o x
o
o
o o o o o oo
o
Aprendizaje supervisado Margen
Mรกquina de Soporte Vectorial (SVM): encontrar recta que genere el mayor margen posible
x x
x x x x
x
x
x o o oo o oo oo o o o o o o
Aprendizaje supervisado Clasificador
x
Redes neuronales: Funciรณn no lineal que en muchos casos permite mejor separaciรณn
x o x o o x ooxxx x o o o x xx x x x o o x xx x oo x xxx x xx x o o ox xxx x o o o o xoox ox o o ox x o o o o oo o oo o o o oo o o o o oo oo o o oo
Aprendizaje supervisado Clasificador
Arboles de decisión:
x
x x
x x x x
Función no lineal basada en reglas que realiza múltiples particiones
x
x
o
x
x
x xx x
o
x
o o o o o oo
o xx x
o
*x * ** * * ** * * * *** ** * * * *
Tipos de aprendizaje En Machine Learning podemos encontrar diferentes tipos de aprendizaje: • Aprendizaje supervisado: Disponemos de datos de entrenamiento con etiquetas • Aprendizaje no supervisado: Se encuentran patrones en datos no etiquetados
• Aprendizaje por refuerzo: Tomar acciones que maximizan una recompenza
Aprendizaje no supervisado Clustering o agrupamiento: • Identificar grupos basado en alguna noción de distancia o similaridad • Aplicado a o Detección de anomalías o Segmentación y compresión de imágenes o Agrupación de opiniones en Twitter o Identificación de patrones de consumo
Aprendizaje por refuerzo • Aprendizaje basado en exploración de acciones y recompensas • Aplicado a: o Control de vehículos no tripulados o Aprendizaje de juegos (Go, Poker) o Detección de fallas en sistemas de seguridad
Aplicaciones en Colombia
Cooperación financiera en comunidades pobres Predicción de irradiación solar sin datos de entrenamiento
Análisis de criminalidad: la ruta más segura
Diseño de trayectorias de riego
Predicciones en agricultura y piscicultura Análisis de nanocompuestos y materiales
Moralidad y ĂŠtica en Machine Learning
• Todo radica en los datos de entrenamiento • Concepto de moralidad tiene que ser incorporado
Más información sobre nuestros proyectos • Luis Felipe Giraldo Trujillo Universidad de los Andes, Colombia lf.giraldo404@uniandes.edu.co • Información sobre grupo de investigación en Machine Learning: http://wwwprof.uniandes.edu.co/~lf.giraldo404/
Curso de verano Curso de verano: Learning Machine Learning - 9 dias, desde Mayo 30 a Junio 11, en la Universidad de los Andes, Bogotá - Profesores invitados: • Joshua Bloom, Universidad de California at Berkeley, fundador de la empresa wise.io • Rafael Martinez, Harvard – Smithsonian Center for Astrophysics
- Abierto a todo público (algunas clases van a estar disponibles para ver línea) - Para mayor información sobre costos, horarios, formato, programa, etc. pueden ver - http://wwwprof.uniandes.edu.co/~lf.giraldo404/LearningML.htm - contactarme directamente, lf.giraldo404@uniandes.edu.co - página del departamento de Ing Eléctrica en Uniandes
Muchas gracias!
lf.giraldo404@uniandes.edu.co http://wwwprof.uniandes.edu.co/~lf.giraldo404/ http://wwwprof.uniandes.edu.co/~lf.giraldo404/LearningML.htm
Aprendizaje no supervisado Ejemplo:
CuĂĄntos grupos podrĂan haber?
Aprendizaje no supervisado Ejemplo: cuĂĄntos grupos podrĂan haber?
La forma de partirlos depende de la distancia