Inteligencia artificial: qué es y diseño de una web con Midjourney y ChatGPT-4

Durante 2022 y 2023 ha habido mucho debate alrededor de la inteligencia artificial (IA), especialmente a raíz del lanzamiento de ChatGPT-4.

Estos son los contenidos de este artículo que, como verás, es más largo de lo habitual. En él te explico qué es esto de la inteligencia artificial, sus orígenes y cómo considero que puede impactar en nuestra profesión. También he probado a diseñar una web utilizando Midjourney, Stable Diffusion y ChatGPT-4.

Espero que te ayude a tener más claras algunas ideas:

  1. Algunos conceptos básicos de la IA
  2. Diseñar con la inteligencia artificial
    1. La IA en el proceso de diseño
    2. Synthetic users
  3. Diseño generado con IA: tres herramientas
    1. Midjourney
    2. Stable Diffusion
    3. ChatGPT-4
  4. Apuntes finales

Disclaimer: seguro que me dejo cosas fuera, no pretendo que este sea el artículo más completo del universo.

Algunos conceptos básicos de la IA

Si hace tiempo que me lees, ya sabes que siempre prefiero introducir los temas dando un poco de contexto.

Por este motivo, empezaré definiendo de la forma más sencilla posible algunos de los conceptos que se están utilizando estos días.

  • Inteligencia artificial (IA): según la RAE, es la “disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana, como el aprendizaje o el razonamiento lógico.” Por tanto, la IA opera en el campo de la lógica, ya que aprenden procesando cantidades ingentes de datos, entre los que buscan patrones para modelar sus propias respuestas.
  • Origen de la IA: el término lo acuñó John McCarthy entre 1955 y 1956, en la Conferencia de Dartmouth. En este punto es necesario indicar que esta conferencia fue el resultado de las teorías y las investigaciones desarrolladas por Ada Lovelace (1840), Alan Turing (1936) y Warren McCulloch y Walter Pitts (1943), entre muchos otros.
  • Modelo de lenguaje LLM: son los modelos de lenguaje de gran tamaño (large language model, LLM), que consisten en una red neuronal con muchos millones de parámetros. Esto permite que aprendan patrones y conexiones entre palabras y frases, con lo que generan nuevos textos.
    • Son capaces de llevar a cabo tareas de generación y clasificación de textos, contestar preguntas en un diálogo y traducir textos de un idioma a otro.
    • GPT-4, de Open AI, utiliza un modelo que incluye imágenes y textos y supuestamente se utilizaron 100 trillones de parámetros para entrenarlo. Según indican en la propia web de Open AI, GPT-4 no aprende de la experiencia y su conocimiento llega hasta septiembre de 2021.

Diseñar con la inteligencia artificial

Es demasiado pronto para poder decir cuál será el impacto real de la IA en nuestra disciplina. Lo que sí es cierto es que parece tener la capacidad de realizar rápidamente las tareas más pesadas, como generar conceptos, probar diferentes estilos y hacer adaptaciones de una imagen.

Esto último ya lo hace Netflix desde 2017.

En cuanto a DALL·E 2, Midjourney o Stable Diffusion (te cuento más sobre las dos últimas herramientas más adelante), actualmente necesitan indicaciones (prompts) de humanos para generar imágenes y variaciones.

No hay que olvidar que actualmente son modelos basados en la lógica y no en el pensamiento creativo. Como dicen en este artículo de El Periodico:

(…) son sistemas que usan cálculos probabilísticos para construir frases en base al océano de datos que extraen de internet. Son como loros: pueden generar un discurso plausible con sentido, pero sin entender su significado.

Lo más importante sigue siendo tu capacidad de entender los problemas de tus usuarios y crear soluciones para ayudarles.

La IA en el proceso de diseño

Diseñar es más que pintar pantallas. Pasamos mucho tiempo defendiendo esta máxima, y justo cuando llega una tecnología y unas herramientas que podrían liberarnos parcialmente de esto, es cuando ponemos el grito en el cielo.

Si echamos un vistazo a un proceso de diseño genérico, grosso modo, tenemos estas etapas:

  1. Identificar el problema. Esto es, entender qué necesitan tanto la empresa como los usuarios y poder ofrecer soluciones. La IA podría resumir esas necesidades, pero la decisión última es de quien diseña. También puede ayudar en la redacción de preguntas para la investigación, o procesar los resultados de una encuesta.
  2. Definir la solución y diseñarla. La decisión de la dirección que tomará el diseño, el estilo y los elementos (como mínimo) corre a cargo de quien está diseñando. La IA puede ayudar con datos adicionales que permitan ajustar mejor esa decisión, pero no la dirección. También puede ayudar a bocetar ideas de forma rápida con las indicaciones que se le den y como apoyo y guía para diseñar todas las pantallas que necesitaría esa interacción.
  3. Prototipar y analizar. El prototipo hay que ponerlo en manos de usuarios. Eso sí, es cierto que están apareciendo conceptos como los synthetic users (en unas líneas te lo cuento en detalle) y hay datos genéricos que pueden ayudar a prever si ese diseño o interacción funcionará bien o no.

Synthetic users

Una captura de la web de Synthetic users. En ella se lee, en inglés "User research. Without the users".

Esta herramienta crea un usuario modelo compuesto a partir de los datos de decenas (¿miles? ¿millones?) de datos de otros usuarios.

Supuestamente, reducirá el coste de las herramientas y los procesos clásicos de investigación con usuarios y, a la vez, permitirá obtener resultados iguales o mejores. Podrás:

  • Realizar entrevistas y explorar problemas
  • Enviar encuestas e identificar áreas de mejora
  • Obtener feedback sobre tus exploraciones iniciales
  • Diseñar experimentos para poner a prueba una suposición (assumption)
  • Organizar reuniones de lluvia de ideas con stakeholders
  • Llevar a cabo tests de usabilidad con prototipos

Obviamente, se pierde el componente humano, que es justo donde está el valor de la investigación: empatizar, profundizar y entender sus emociones y sus historias.

Estas herramientas permitirán trabajar con datos agregados disfrazados de un usuario, pero estarán basados en patrones y estereotipos. Niloufar Salehi probó Synthetic Users en uno de sus productos y su conclusión fue que:

Así que mi conclusión principal es que no lo utilices. No proporciona ninguna sustancia sobre la vida real de las personas, más allá de lo que es estadísticamente más probable (estereotipos). Está desperdiciando energía y produciendo carbono innecesario, y está engañando de forma poco ética a las personas para que piensen que un motor de síntesis de patrones (LLM) puede programarse para una entrevista e incluso que puedes darles las gracias después.

Con el objetivo de traerte otra visión, yo también he hecho una prueba utilizando su beta. Estos son los datos que he introducido:

  • Audiencia: 35-year-old professional, who has a steady job, a mortgage, and some savings in her checking account.
  • Problemas:
    • Not knowing what to do with her money
    • Has no knowledge about how investments work
    • Wants to save money for when she retires
  • Solución: A platform where you can learn about investing, chat with investors, and learn how to plan what to do with your money.

De inicio es curioso, porque mientras carga los resultados, te va hablando del proceso habitual: buscando personas para entrevistas, agendando la entrevista, preparando las preguntas, realizando la entrevista, dándole las gracias.

Todo esto no está pasando. No sé si tiene mucho sentido utilizar estos textos en una pantalla de carga, porque son claramente engañosos: no es real.

La interfaz de la web de Synthetic users, donde se ven tres columnas: Audiencia, Problemas y Soluciones.

En cuanto a los resultados, en mi caso ha “entrevistado” a tres usuarios que encajan dentro del perfil que he definido. Mi opinión:

  • Coincido con Salehi en que da respuestas excesivamente estereotipadas
  • El contenido parafrasea en varias ocasiones los prompts que he facilitado, asumiendo que los problemas que yo he escrito son las preocupaciones de los usuarios. Podrían serlas, pero no dejan de ser tres suposiciones que he hecho. Si lees el sumario (puedes descargarlo aquí) verás que se parafrasea mucho.

¿Es útil? Por ahora no me lo parece demasiado. Como mucho, puede servir como herramienta para generar ideas.

En resumen

Sobre si la inteligencia artificial nos dejará el trabajo: en su estado actual, pienso que el mayor impacto está en que modificarán nuestros procesos al diseñar y que se crearán herramientas que complementarán nuestro trabajo.

Puede ser que eliminen las tareas más tediosas, como leer análisis e invertir horas en preparar conceptos, pero eso no significa que eliminarán por completo el trabajo que hacemos. También hay que considerar que estos resúmenes tendrán sesgos (como los nuestros, ojo), por lo que tampoco habría que creérselos a pies juntillas.

¿Que si devaluará partes de la profesión y reemplazará algunos perfiles? Puede ser, pero en última instancia también dependerá de cada empresa. Quizás estoy siendo muy optimista, lo sé, pero prefiero no caer en catastrofismos.

Diseño generado con IA: tres herramientas

He experimentado con las siguientes herramientas. Con el objetivo de poder compararlas, he intentado, en la medida de lo posible, generar un resultado que permita obtener material para:

Una web bonita y minimalista para vender trajes a astronautas para que viajen a Marte.

Midjourney

Midjourney está disponible a través de Discord, desde donde podrás escribir indicaciones (prompts) para obtener el resultado que esperas.

Obtendrás resultados bastante creativos, ya que se pueden añadir multitud de variaciones en cada prompt y, además, generar variaciones sobre los resultados que has obtenido.

En una entrevista publicada en 2022, David Holz, fundador de Midjourney, decía que:

(…) muchos artistas gráficos utilizan Midjourney como parte de su flujo de trabajo de desarrollo de conceptos. Generan algunas variaciones de una idea y se las presentan a los clientes para ver qué dirección deben seguir.

Con la indicación que hay a continuación, el bot generará cuatro imágenes, que podrás utilizar como base para generar variaciones. Si buscas una guía para generar buenas indicaciones, MidJourney Prompt Helper te ayudará.

web design for a company that sell suits for astronauts to travel to Mars --ar 3:2

He probado otras instrucciones con alguna variación para ver qué obtenía:

web design for a company that sell suits for astronauts to travel to Mars --ar 3:2 --no shading realism photo details

Y con este:

web design for a company that sell different suits for astronauts to travel to Mars --ar 3:2 --no shading photo details

Ya que he pagado el acceso al plan básico, he aprovechado para generar imágenes con las que ilustrar esta supuesta web.

/imagine prompt: Astronaut in Mars, surrounded by other astronauts. The earth is on the background.:: photorealistic::1 crepuscular rays::1 360 panorama::1 --v 4

Como variación de la tercera imagen, me ha generado estas cuatro:

Stable Diffusion

La diferencia principal es que es open-source (si quieres, puedes acceder a su repositorio en GitHub) y, por este motivo, hay varias plataformas que utilizan su API para crear generadores. Estos son los resultados que he obtenido con DiffusionBee.

Después de muchos intentos y modificar varias veces las indicaciones, este es el mejor resultado:

web design to sell suits for astronauts to travel to Mars

También he intentado generar ilustraciones para la web:

Astronaut on Mars, photorealistic, crepuscular rays, panorama, futuristic, science fiction

Comparado con MidJourney, Stable Diffusion genera resultados más impredecibles y con menos realismo y calidad.

ChatGPT-4

Como te contaba al inicio del artículo, GPT-4 se basa en LLM. Esto significa que, teóricamente, puedes utilizarlo para que te ayude en algunas partes del proceso de diseño:

  • Escribir textos
  • Analizar el feedback que recibes cuando llevas a cabo una investigación cualitativa, porque tiene la habilidad de sintetizar la información
  • Generar conceptos e ideas cuando le facilitas indicaciones que incluyen en reto o problema a resolver
  • Preparar ejercicios de investigación con usuarios: le indicas qué quieres aprender y te creará las preguntas que podrías utilizar

Le he pedido que escriba el contenido para la web:

Welcome to our website, the ultimate destination for astronauts who are preparing to embark on a journey to Mars. We specialize in providing you with the finest suits that have been designed to meet the challenges of interplanetary travel.

Our suits are made with the highest quality materials and are designed to provide maximum protection against the harsh conditions of space travel. We understand the importance of comfort and flexibility, which is why our suits are tailored to fit your body perfectly, allowing for a full range of motion.

Our minimalist website reflects the simplicity and elegance of our suits. We believe that less is more, and we have kept our design clean and straightforward to ensure a seamless user experience.

We offer a variety of suits to meet your specific needs. Whether you’re looking for a lightweight suit for short-term missions or a heavy-duty suit for extended stays on Mars, we’ve got you covered. Our suits are available in a range of sizes, ensuring a perfect fit for every astronaut.

In addition to our high-quality suits, we also offer a range of accessories to enhance your experience. From helmets and gloves to boots and backpacks, we have everything you need to make your journey to Mars as comfortable and safe as possible.

At our website, we are committed to providing you with exceptional customer service. Our knowledgeable and friendly team is always available to answer any questions you may have and to help you find the perfect suit for your needs.

Thank you for choosing our website for your interplanetary travel needs. We look forward to serving you and helping you make your journey to Mars a success.

Y también le he preguntado por las páginas que debería tener una web que venda trajes para astronautas:

Here are some pages that would be useful for a website selling suits for astronauts to travel to Mars:

  1. Home page: This is the main landing page of the website, which should provide an overview of the products and services offered.
  2. Products page: This page should showcase the different types of suits available for purchase, including details about the materials used, design features, and pricing.
  3. Accessories page: This page should highlight the different accessories available for purchase, such as helmets, gloves, boots, and backpacks, with detailed descriptions and pricing.
  4. About page: This page should provide information about the company, including its mission, values, and history.
  5. FAQ page: This page should answer common questions that customers might have about the products and services offered, such as sizing, delivery times, and warranties.
  6. Contact page: This page should provide customers with a way to get in touch with the company, such as through a contact form or email address.
  7. Testimonials page: This page should feature reviews and testimonials from satisfied customers, which can help build trust and credibility with potential buyers.
  8. Blog page: This page should feature informative blog posts about topics related to space travel and the challenges of living on Mars, which can help establish the website as a thought leader in the industry.

Podría continuar preguntándole el contenido de cada una de las páginas, pero creo que ya ves por donde van los tiros 👀

Esto, mezclado con las propuestas de Midjourney y Stable Diffusion te da para empezar a diseñar. Aunque seguramente tú habrías llegado a resultados similares.

Apuntes finales

Espero que este resumen te haya sido útil para entender un poco mejor qué es la inteligencia artificial y cómo son las herramientas que hay actualmente.

Simplificándolo mucho, ya ves que la IA son modelos de lenguaje que han aprendido con millones de datos y que siguen patrones lógicos para ofrecer respuestas a nuestras preguntas. A corto plazo, parece que pueden liberarnos de tareas que se perciben tediosas.

En cuanto a la inteligencia artificial en sí, hay varias maneras de entender estos cambios. Por mi naturaleza, prefiero decantarme por la prudencia: no saltaré al carro de venderlo como el gran cambio tecnológico de los últimos 1.000 años, pero tampoco lo ignoraré por completo y me convertiré en ludita.

Personalmente, hay dos aspectos que me preocupan. Uno de ellos es el impacto medioambiental. En este artículo hablan de dos estudios en los que detallan que:

(…) se estima que ChatGPT, un modelo de conversación desarrollado por OpenAI, consume una botella de 500 ml de agua por cada conversación de 20 a 50 preguntas y respuestas.

Otro es que, lamentablemente (aunque no del todo inesperado) estos modelos de lenguaje tienen sesgos. Abeba Birhane, Senior Fellow in Trustworthy AI en Mozilla e investigadora de temas relacionados con la inteligencia artificial, publicó esto en Twitter:

Un ejemplo del racismo que pueden crear las herramientas de inteligencia artificial.

El prompt de la imagen de la izquierda es "african people at work" y salen tres personas negras. El de la derecha es "european people at work" y muestra tres personas blancas en una oficina con vistas a lo que parece la Catedral de Saint Paul de Londres.
El sesgo es bastante claro en este caso…

Lo que tampoco acaban de llevar bien es el humor:

@pablomeixe

Probando las capacidades de la inteligencia artificial para sustituír humoristas 🎭 #inteligenciaartificial #chatgpt #IA #gracioso #comediaenespañol

♬ sonido original – Pablo Meixe

Te recomiendo seguir a Ariel Guersenzvaig, ya que su visión te permitirá balancear un poco con el hype que hay en todas partes.

P.D: Tengo previsto escribir una segunda parte probando plugins de Figma que utilizan la API de Open IA, porque quizás está allí el mayor impacto para el diseño de productos digitales.

¿Te ha gustado? ¡Compártelo! 🚀