Los modelos generativos, también llamados GANs (Generative Adversarial Networks), permiten la creación de datos (e.g. imágenes) que no existen. En un artículo anterior vimos como los modelos generativos se habían utilizado para generar fotos de habitaciones de hoteles, caras humanas e incluso música.
El último avance en la generación de caras nos viene de la mano de ingenieros de Samsung (en Moscú) y del Instituto de Ciencia y Tecnología de Skolkovo.
Su trabajo es muy novedoso porque permite generar diferentes poses de la cara que queramos a partir de muy pocas imágenes, incluso a partir de sólo una imagen. Sin embargo, han necesitado una cantidad ingente de datos para entrenarlo de forma que sea tan genérico.
En este trabajo, primero detectan los puntos de referencia de la cara, tales como la nariz, ojos, boca, cejas y perímetro de la cara. Estos puntos de referencia son los que van a permitir cambiar la pose de la cara que queramos. El modelo generativo está condicionado a estos punto de referencia.
Aunque el modelo generativo se haya entrenado con vídeos y con fotos, también funciona con imágenes. En particular, a mi me ha gustado cómo le han dado vida a la Mona Lisa de Leonardo da Vinci.
Los autores hablan de las aplicaciones posibles de esta tecnología:
- Telepresencia: teleconferencias y juegos multi-jugador
- Efectos especiales
La tecnología funciona bastante bien, aunque todavía necesita mejorarse. Todavía es fácil darse cuenta que las imágenes no son del todo reales. Además, de vez en cuando, también aparecen aberraciones en las imágenes que lo delatan. De cualquier forma, el progreso de este trabajo es fascinante y sólo nos permite imaginar lo que vendrá en el futuro.
Para saber más puedes leer el artículo de investigación completo aquí.