La Inteligencia Artificial se ha convertido en un “trending topic” en los últimos meses. Casi de la noche a la mañana, nos encontramos con la web inundada de imágenes creadas con una herramienta llamada Stable Difussion, y con los medios generalistas hablando de conflictos de intereses entre el mundo del arte “tradicional” y el de las imágenes creadas a partir de una descripción de texto. También se ha hablado y habla de DALL-E 2, que es otro ”modelo” que va “construyendo” las imágenes básicamente a partir de un estado inicial que es básicamente ruido que se va “esculpiendo” con el contenido de los “prompt” de texto a través de sucesivas iteraciones. Mindjourney es otra de las "IA" que permite generar imágenes.
Después, llegó también como un elefante entrando en una cacharrería, ChatGPT, el chatbot de la empresa OpenAI, que se abrió al público a finales del pasado año, y que ha ido ganando adeptos y menciones en los medios, gracias a la elevada calidad de los resultados obtenidos cuando le pedimos que nos cuente algo sobre infinidad de temáticas.

El chatbot ChatGPT tiene un cociente intelectual de 147 en habilidades verbales. Nada menos.
De hecho, es factible usar las respuestas de ChatGPT para generar entradas de posts, sin más que realizar un proceso de revisión y edición mínimos. Que sea posible, no significa que sea deseable u óptimo, eso sí. Nosotros hemos preguntado a ChatGPT “¿Qué ordenador es más eficiente?” y la respuesta, con todo lo que tiene de correcta en apariencia, contiene algunas ausencias, como la mención a los procesadores Intel Core de 12th o 13th Gen, al tiempo que habla de los procesadores de la serie “Y”.
El resultado es, a día de hoy, la prevalencia de la IA como una tendencia consolidada y capaz de integrarse en la vida cotidiana de un modo robusto y con aplicaciones tangibles y concretas. De hecho, el portal web CNET, ya ha usado ChatGPT para escribir algunos artículos, como se describe en este post, aunque el resultado deja mucho que desear. Hablaremos de ChatGPT con detalle más adelante, aunque adelantamos que uno de los problemas de ChatGPT es que sus respuestas, a pesar de ser sumamente convincentes en cuanto a la forma de expresarse, pueden contener (y de hecho contienen) errores “de bulto”.
En cuanto a la generación de imágenes, Stable Difussion ya se ha empleado para crear obras que se han presentado a concursos de arte, ganando incluso en algunas categorías, como se cuenta aquí. Stable Difussion es la plataforma más fácilmente accesible y que, incluso, podemos instalar localmente en nuestro ordenador, siempre que tengamos una gráfica NVIDIA con al menos 6 GB de VRAM, siendo preferibles 8 GB. Además de Stable Difussion, tenemos Midjourney y Dall-E como otras propuestas dignas de mención, aunque no tan fácilmente accesibles. O no de forma gratuita, al menos.

Esta imagen de Jason Allen está creada mediante IA: “Théâtre D’opéra Spatial,” y ganó el primer puesto en la categoría digital en la feria Colorado State Fair.
¿Qué es realmente la IA?
Cuando hablamos de IA, nos referimos a automatización extrema. La inteligencia no es tal realmente, sino “aproximada” estadísticamente. Stable Difussion usa como eje central de su operativa, un modelo estadístico “entrenado” a partir de millones de imágenes tomadas de Internet que han permitido definir patrones de “construcción” de las creaciones gráficas a partir de “prompts” de texto.
ChatGPT funciona de forma similar, debiendo su buen hacer en las respuestas, a un entrenamiento exhaustivo de los modelos definidos para su funcionamiento. Se basa en el modelo de OpenAI GPT-3.5 o Generative Pre-Trained Model 3. Emplea Deep Learning o aprendizaje profundo con 175.000 millones de parámetros. Hablamos de modelos sumamente complejos, pero no inteligentes.
Estos modelos no “saben” realmente lo que dicen: siguen reglas, mejores o peores, pero reglas al fin y al cabo, generadas a través de cálculos probabilísticos en los que se “premian” las mejores respuestas. De este modo, son incapaces de identificar errores que serían evidentes para cualquier persona, al ser “de bulto”. ChatGPT construye las respuestas a partir de reglas sin “inteligencia”. A cualquiera le puede “oler mal” una respuesta que se sale del contexto de la pregunta aunque no conozca a fondo el tema sobre el que se le pregunta, pero la IA carece de intuición deductiva.

Tras los anuncios realizados por OpenAI para ChatGPT, está complicado acceder normalmente al chatbot.
Así pues, la IA se sustenta sobre fundamentos de lógica y estadística en el fondo. Los datos con los que ha sido entrenada una IA como Stable Difussion o ChatGPT también limitan el ámbito de las respuestas o las imágenes generadas, aunque al tratarse de conjuntos de datos muy amplios, se tiene la sensación de que la IA es capaz de llevar a cabo las tareas para las que ha sido diseñado.
En cualquier caso, ChatGPT puede verse como una forma automatizada y rápida de recabar información sobre los temas que se le preguntan. Además, ChatGPT no tiene acceso a Internet, por lo que no es capaz de actualizar las respuestas. Por ejemplo, si se le pregunta por los procesadores Raptor Lake, habla de ellos como una tecnología futura. No “sabe” que ya se han presentado algunos procesadores y se conocen los detalles sobre su arquitectura.
Stable Difussion, por su parte, también es una herramienta de automatización. En este caso, rellena las imágenes con elementos gráficos y detalles de acabado, definidos en los prompts (entradas de texto) donde se describe el resultado que se pretende obtener.
En ChatGPT, el entrenamiento se basa en técnicas como la de eliminar palabras de frases y hacer que el algoritmo encuentre las opciones más favorables, a través de métricas que premian las elecciones óptimas. En última instancia es estadística y probabilidad en lo que se basan los algoritmos de IA.
No hay nada “mágico” ni “inteligente” en estos algoritmos. Este artículo-entrevista lo expone de un modo claro. Podemos verlo así: en nuestro día a día integramos una gran parte de automatización en nuestras tareas, donde no intervienen elementos como la consciencia o la creatividad. Este tipo de tareas son las que compiten con la IA y las que, por ejemplo, están en riesgo de ser realizadas por la IA en vez de por humanos.
Si, por ejemplo, escribiéramos este artículo sin aplicar cierto sentido crítico, contexto o perspectiva, ChatGPT podría perfectamente sustituirnos como redactores sin demasiada dificultad, pero, en casos como el de los procesadores que describimos anteriormente, la información podría carecer de completitud o veracidad.
En las dos secciones siguientes profundizaremos un poco más en las posibilidades de la IA en los casos concretos de la generación de imágenes y ChatGPT.