Redes generativas adversarias: la IA está aprendiendo de forma exponencial

Las GANs, dos inteligencias artificiales combinadas para dar un mejor resultado, ya están aquí. Gracias a combinar dos IA compitiendo entre sí, su avance es exponencialmente más rápido que por separado.

Esta tecnología tiene importantes implicaciones éticas. ¿Es bueno dar a todo el mundo el poder de editar la realidad? ¿Cómo podría afectar a la economía que cualquiera pueda crear un vídeo falso hiperrealista? ¿Qué hay de los juicios?

¿Qué son las redes generativas adversarias (GANs)?

También llamadas redes generativas antagónicas (RGAs), las redes generativas adversarias son un sistema de aprendizaje no supervisado en que dos inteligencias artificiales compiten entre sí para lograr un objetivo.

Pongamos que ese objetivo es generar un paisaje fotorrealista. La Red A recibe la misión de generar dicha “fotografía”. La Red B recibe la misión contraria: detectar fotomontajes.

El juego empieza, y la Red A “dibuja” miles de imágenes relativamente malas. Como resultado, la Red B le dice todas aquellas imágenes en las que le ha pillado, y por qué. En una segunda tanta, la Red A lo hace mejor, así como la Red B.

Enfrentadas una contra la otra, no les queda otra que mejorar sus respectivas tácticas. La Red A será cada vez mejor componiendo fotopaisajes, como el ejemplo del río, y la Red B será cada vez mejor detectando aquellos menos realistas.

redes generativas adversarias imagen

Ventajas de las redes generativas adversarias

Traslademos la situación a dos jugadores humanos en una partida de damas. Las inteligencias artificiales de las GANs no tienen por qué ser diferentes. A veces se enfrentan entre sí dos IA iguales, como en el caso de nuestros jugadores.

A lo largo de miles de partidas, ambos jugadores han mejorado y saben adelantarse a la estrategia del otro. Aunque para que esas miles de partidas tengan lugar con personas hace falta mucho tiempo. No con las GANs.

Además de rápidas, las redes generativas antagónicas se adaptan a un entorno muy específico. Orientadas a ganar en un juego, rápidamente se hacen con las reglas básicas y superan a los jugadores humanos.

Esto tiene usos en una gran cantidad de sectores. Diseño de plantas industriales, generación de efectos especiales, dar vida a imágenes en 2D, e incluso gestionar los flujos de una ciudad.

Al tener dos IA enfrentadas, estas aprenden de forma exponencial al enfrentarse cada una a una IA que a su vez mejora. Es la expresión perfecta de un sistema darwiniano.

Ejemplos de éxito de GANs

Es posible que no seamos capaces de imaginar para qué pueden servir las redes generativas adversarias. Acostumbrados a ser los únicos seres que aprenden al enfrentarse, ¿para qué podría usarse una GAN? Mostramos ejemplos recientes.

Relatos capaces de volver a la vida

La Universidad de Cornell logró en 2019 generar un vídeo falso a partir una única fotografía. Hasta entonces habían hecho falta miles de fotografías para dar un acabado realista.

Sintetizar audio realista

Muchos de los lectores recordarán a Loquendo. Durante años su voz se ha usado en vídeos, GPS, videojuegos o asistentes de voz. Sin embargo, sonaba demasiado artificial, algo que las GAN cambiarán pronto.

El trabajo ‘Adversarial audio synthesis’ presentado en la conferencia ICLR 2019 muestra cómo generar audio realista. Dos IAs enfrentadas: una genera audio y otra informa de los errores. Como resultado, no dejan de avanzar.

Dibujar en Paint imágenes impactantes

El vídeo de abajo puede resultar chocante. La red generativa adversaria de NVIDIA permite con una interfaz muy sencilla dibujar paisajes que parten de garabatos. Pronto cualquiera podrá diseñar sus propios escenarios, y ya podemos probar una demo con la que sentirnos dioses del Paint.

Fingir cualquier actividad

El postureo se ha vuelto un clásico en internet. Ahora imagina cómo cambiarían las redes sociales si somos capaces de “grabarnos” a nosotros mismos bailando como profesionales, escalando o haciendo parkour.

De momento la Universidad de Berkeley ya logró que los cuerpos de sus ingenieros simulasen bailar gracias a una red generativa adversaria especializada en simular esqueletos y su movimiento.

Propiedades emergentes de los ‘deep fakes’

De momento las GANs tienen más vocación para generar contenido falso (deep fakes) que cualquier otra actividad. Esto podría traernos consecuencias indeseadas.

Las propiedades emergentes de un sistema son aquellas que aparecen como consecuencia de la interacción de elementos “simples”. No pueden preverse, aunque si estudiamos a las inteligencias artificiales igual imaginamos algo.

Supongamos por un instante que todos somos capaces de sintetizar cualquier imagen y voz. ¿Qué pasaría con la confianza que tenemos en nuestros sentidos? Si soy capaz de simular una llamada de un familiar, ¿me enviarías dinero?

¿Cómo se comportará la economía cuando todos seamos capaces de manipular cualquier imagen que subimos o cuando esté en nuestro poder el generar noticias falsas hiperrealistas? O vídeos.

Hoy el sistema judicial admite como prueba un vídeo en el que se nos vea haciendo algo. Pero si cualquiera tiene la capacidad de generar ruido, ¿seguirán sirviendo las pruebas visuales?

Pensemos en cómo cambió la cultura global con los smartphones. Ahora tratemos de imaginar lo que será para la sociedad este nuevo superpoder.

 

En Lenovo | ¿Por qué plegar proteínas es un logro para la inteligencia artificial?

Imágenes | iStock/v_alex, Marcos Martínez (NVIDIA)

Etiquetas: