Microsoft ha presentado un nuevo bot dibujante que puede crear imágenes, pixel a pixel de objetos a partir de la descripción que le demos. Este bot ha conseguido mejorar la calidad de las imágenes así creadas hasta 3x comparado con la tecnología anterior de generación de imágenes usando tests estándar.
En la imagen se puede ver un pájaro común. La imagen ha sido dibujada por la IA más reciente de Microsoft a partir de una breve descripción de texto tal que "un pájaro amarillo con alas negras y un descanso sobre una rama". Puede que este pájaro exista en la vida real, o no. La clave está en que este bot puede dibujar desde un pájaro hasta un autobús de doble piso volando.
La IA usa "su propia imaginación" para llenar los huecos en los dibujos que hace a partir de una GAN o Generative Adversarial Network. En este caso tenemos dos IAs "adversarias" que son en realidad dos modelos de Machine Learning diferentes: uno para generar las imágenes, y otro para comprobar si las imágenes son fidedignas a partir del análisis de la descripción.
En la segunda imagen se ven los resultados obtenidos a partir de otras descripciones de texto, con resultados mucho mejores que los obtenidos con previas generaciones de IA. En el mundo real, las aplicaciones de este bot son múltiples, como la de ser un asistente para pintores o interioristas, o una herramienta de retoque fotográfico mediante voz. El siguiente paso parece ser el de crear animaciones basadas en guiones, para reducir las tareas asociadas con la animación en los estudios de cine.

