6 minute read
Inteligencia artificial
from Pulso 314
Julio Navarro
Imagina que quieres hablar con alguien sobre un tema en específico y no conoces a nadie que le interese, que sepa del tema o que le permitan estar contigo en horas del día o de la noche que cualquiera ocuparía para trabajar o hacer lo que sea. ¿Difícil, verdad? Pues ya existe un programa de computadora capaz de hacer eso, de hecho hay varios: cuando le preguntas algo a Alexa, Siri o Google, a través de tu teléfono celular o a través de una bocina inteligente, esperas una respuesta que esté relacionada con el tema por el que preguntaste; pero ¿cómo lo hace?
Advertisement
Partimos de un sistema electrónico (micrófono y preamplificador) que convierte la voz en impulsos eléctricos que se convierten en bits (a partir de un convertidor analógico digital), luego, la salida digital me genera una serie de patrones que se deben someter a un conjunto de programas que identifican cada palabra y la convierten en texto, similar a lo que hace Word cuando le dictas o con programas de reconocimiento de voz como Voice Dragon. Ya que se tiene el texto, se analiza de qué idioma se trata y se va haciendo más complicado, porque luego de eso, se analiza la oración para saber qué quiere el usuario que generó la pregunta. Esta es la parte más sofisticada del asunto, pues el fraseador logra identificar lo que el usuario pide en la medida que se haya programado con la complejidad necesaria y con las fuentes de información suficientes para luego tomar una decisión sobre cuál de esas fuentes de información podría tener la respuesta que el usuario desea saber.
Los que han sentido la frustración de recibir respuestas pobres, sin sentido, absurdas o ajenas a lo que se pide, me darán la razón. Pero también está la respuesta fatídica: “lo siento, no te entendí”, o parecidas que no nos ayudan en nada. Pero hace algunos años, ingenieros de varias empresas de tecnología empezaron a tener logros sorprendentes en este proceso. Uno de ellos, Google, creó chatGPT, un programa conversacional que está basado en un lenguaje especial de programación llamado
LaMDA (Language Model for Dialoge Applications). Según el equipo de Google, no estaba listo para salir al mercado para no generar mala reputación si llegaba a fallar. Pero la competencia de otras compañías presionaron a Google para que sacara una versión comercial lo antes posible, para que no se le adelanten y pierda su lugar como líder en las aplicaciones conversacionales inteligentes. Por eso, el 7 de febrero, anunció el lanzamiento de Bard. La capacidad de este sistema de IA (inteligencia artificial) se hizo evidente cuando un ingeniero del equipo de Google llamado Blake Lemoine afirmó que el programa tenía conciencia propia y por esto fue despedido. Pero lo cierto es que las pláticas que tuvo con el programa sobre temas de religión, robótica y conciencia con el ingeniero le hicieron pensar así. Además, el programa contrató un abogado para defender sus derechos como persona viva y consciente. El ingeniero publicó la conversación con LaMDA y realmente parece tener conciencia.
Hay celebridades, como el físico Stephen Hawking, Steve Wozniak de Apple y Elon Musk -además de una comunidad de más de 1000 expertos- que firmaron una petición para prohibir el uso de inteligencia artificial en el armamento bélico.
Hay dos clases de inteligencia artificial: la general y la especializada o estrecha; esta última es capaz de imitar la inteligencia humana y aprende a resolver problemas de un tema específico mediante el cruce de enormes cantidades de datos y sacando conclusiones lógicas. Bajo este concepto se creó un programa que, alimentado por miles de videos de YouTube, pudo saber lo que era un gato, aunque no se le había enseñado tácitamente al programa qué era un gato, pero lo dedujo.
Una compañía llamada DeepMind promociona su programa de inteligencia artificial llamada Gato, lanzada al mercado en mayo de 2022 y tiene capacidad para hacer más de 600 tareas diferentes: desde acomodar objetos con un brazo robot, analizar imágenes y hasta jugar Atari. Otro modelo de inteligencia artificial llamado GP3 fue creado por la compañía OpenIA y es capaz de aprender el lenguaje humano. Lo lanzaron en el año 2020 y en su momento fue el sistema con más parámetros, lle- gando a 173 billones. Al poner un sistema como este dentro de un robot, tendremos un robot que aprende a hablar. Google entrenó a PaLM, un sistema de inteligencia artificial con asombrosos 540 billones de parámetros y con esto es capaz de manejar con fluidez el lenguaje humano, la aritmética, conocimientos generales, traducciones, reconocimientos de patrones entre otras cosas.
OpenIA también hizo Dalle1 y 2, contrapartes de Google con su propuesta llamada Imagen; ambas tecnologías de IA son capaces de crear imágenes - antes jamás vistas- desde cero a partir de un texto que se le proporcione; incluso puede crear nuevas imágenes a partir de originales. El equipo de desarrollo de DeepMind mostró un programa capaz de procesar texto e imágenes para dar una respuesta de texto, es decir, analiza el contenido de una imagen y genera un comentario de texto, todo esto con un algoritmo de VLM (Visual Language Models). Esto se logra con sistemas de reconocimiento de patrones, algo similar a lo que hace el OCR (optical character recognition) para convertir una imagen en letras, cada una de las cuales se compara con un conjunto de patrones para identificar cada letra.
En el caso de las imágenes, se alimenta el sistema con un gran conjunto de imágenes de un mismo objeto, animal o cosa para lograr esta identificación, por ejemplo, si en una foto está un perro, el programa compara contra las miles o millones de imágenes de perros en diferentes posiciones, tamaños y colores hasta encontrar un parecido, así, se genera una matriz de datos sobre perros que cumple con criterios específicos como cantidad de patas, textura del pelambre, tipo de orejas, etc. También identifica el fondo, esto se hace comparando las millones de fotos alimentadas como paisajes, pudiendo reconocer características del estado de los árboles, el pasto, las nubes y las montañas para saber datos del clima, estación del año en que se tomó la foto y hasta el lugar donde se tomó. Pese a todos estos sorprendentes avances, la inteligencia artificial general, es decir, la que puede abordar cualquier problema de cualquier tema y darle solución o hablar coherentemente de lo que sea, no existe todavía. Los avances siguen y en algún momento en el futuro cercano esto será una realidad.
La historia de la inteligencia artificial se remonta al año
1943 con un artículo científico que publicaron Warren McCullough y Walter Pitts sobre un modelo matemático que permitía crear una red neuronal, esto es, un conjunto de “neuronas artificiales” que tratan de imitar el comportamiento de una neurona humana. Esto sirvió como base para construir la primera computara con una red neuronal en 1950, llamada Snarc, por Marvin Minsky y Dean Edmonds, dos alumnos de la universidad de Harvard. Durante los años siguientes hubo grandes avances en este campo y varias empresas invirtieron sumas millonarias en investigación para lograr llevar la delantera, varias universidades privadas del mundo tienen programas ambiciosos sobre inteligencia artificial. El MIT (Massachusetts Institute of Technology) tuvo problemas con un software de reconocimiento de rostros cuando se trataba de mujeres de piel oscura y algunos reporteros lo tacharon de racista.
Otro lugar importante de la inteligencia artificial está en la conducción de vehículos autónomos. Todos los sistemas de reconocimiento de patrones a bordo le permiten distinguir su entorno y tomar decisiones al respecto. Pero no son perfectos, esto quedó demostrado cuando varias personas fueron atropelladas y algunas murieron durante la etapa de pruebas de esta clase de autos. Los drones militares tienen algunos sistemas de navegación inteligentes que les permiten modificar sus patrones de vuelo si las condiciones climáticas cambian y ponen en riesgo al dron mismo. Hay que recordar que los drones tienen muchas formas, algunos parecen aviones pequeños, otros, parecidos a los que conocemos los civiles, pero también hay drones submarinos.
El sueño de tener un robot que nos pueda servir de compañía y poder conversar con él como un ser pensante y sintiente está cada vez más cerca; las 3 leyes fundamentales de la robótica seguramente serán instaladas en los nuevos modelos, dichas leyes se mencionan en varios libros de ficción del autor Isaac Asimov, películas como El hombre Bicentenario dejarán de ser sueños del séptimo arte. Puede ser que nos enfrentemos a dilemas éticos como el que se plantea en la película y se genere una nueva sociedad, para evitar el esclavismo de los nuevos entes.