unnamed-1

Durante las últimas décadas, la inteligencia artificial ha hecho progresos espectaculares en diversos campos, desde la medicina hasta las líneas de producción de las fábricas. Una brecha que no ha podido ser superada, sin embargo, es la que tiene que ver con los comandos de voz. Pero esta brecha podría ser una frontera a punto de desaparecer.

El programador Cris Valenzuela, investigador residente del programa de telecomunicaciones interactivas de la Universidad de Nueva York, ha creado un generador de imágenes que se activa con las palabras que se te ocurran (siempre y cuando estén en inglés).

El generador trabaja en tiempo real mientras escribes las palabras, por lo que la imagen poco a poco va “traduciendo” los enunciados y frases a imágenes. Los resultados no son espectaculares en términos de realismo en este punto, pero definitivamente son evocativas.

Por ejemplo, al introducir “Football players on a field” (jugadores de futbol en el campo), la imagen resultante parece una pintura abstracta que, sin embargo, muestra colores que podemos reconocer como los de un campo de futbol durante una contienda deportiva: un campo verde abajo, movimiento de alguien que usa un jersey rojo y blanco, pedazos de un rostro y formas color carne que recuerdan a brazos y piernas en movimiento.

Este proyecto es resultado de una investigación llamada Attention Generative Adversarial Network (AttnGAN), basado en un procesador de gráficos que aprende poco a poco de las interacciones con los usuarios.

El AttnGAN tal vez no pueda darte una imagen precisa en poco tiempo, pero al jugar un poco con el programa puedes crear imágenes que parecen salidas de un sueño: algo que recuerda vagamente a las frases, o mejor dicho, como una imagen vista en nuestros recuerdos.

¿Será posible que estas imágenes expresen, tal vez involuntariamente, la forma en la que la mente humana procesa las imágenes? ¿Estamos esperando demasiado de la inteligencia artificial en este punto? No lo sabemos a ciencia cierta. Lo que es verdad es que el AttnGAN es un sitio donde puedes pasar un rato divertido introduciendo las frases más alucinantes y excéntricas, y observando cómo la inteligencia artificial traduce los dictados de tu imaginación.

unnamed
  

Imágenes: Cris Valenzuela

http://www.faena.com/aleph/es/articles