OpenAI anunció mejoras para DALL-E, su generador de imágenes basado en inteligencia artificial que ya puede combinarse con ChatGPT

La empresa, dedicada a desarrollar productos que funcionan a través de inteligencia artificial, explicó que esta aplicación podrá utilizarse dándole indicaciones al chatbot para generar una composición visual, sin la necesidad de aclarar detalles técnicos

Una de las imágenes generadas con DALL-E 3.

OpenAI, empresa dedicada al desarrollo de tecnologías basadas en Inteligencia Artificial (IA), anunció mejoras para su herramienta de generación de imágenes, DALL-E, que ya alcanzó su tercera versión. La novedad más importante es que los usuarios podrán utilizar el chatbot de la compañía, ChatGPT, para obtener resultados más complejos a partir de pedidos más simples.

La integración de DALL-E 3 con ChatGPT implica que quienes usen el generador de imágenes podrán contar con la asistencia del chatbot para simplificar, de esta manera, los denominados «prompts», que son los comandos de texto en los que se basa el sistema para generar los resultados.

La diferencia con la versión anterior de la aplicación radica en que, para obtener imágenes más detalladas, era necesario incluir especificaciones propias del ámbito del diseño, un tipo de conocimiento con el que no todos los usuarios cuentan. Desde ahora, se le podrán dar indicaciones menos elaboradas al chatbot para generar una obra y, a su vez, ir mejorándola.

De esta manera, el usuario podrá escribir un texto corto con su pedido para la imagen, y ChatGPT se encargará de «ajustar» los detalles técnicos.

Qué es DALL-E, el generador de imágenes de OpenAI

El nombre de este sistema surge a partir de la combinación de los del personaje de Pixar, Wall-E, y el artista Salvador Dalí. Lanzado en 2022, DALL-E funciona a partir de un algoritmo entrenado con millones de imágenes etiquetadas extraídas de la web y otras fuentes.

A partir de todas esa imágenes de referencia, lo que hace la aplicación es determinar cómo renderizar una imagen a partir de la solicitud del usuario.

A modo de ejemplo, el sistema de DALL-E 3 generó una imagen a partir del siguiente pedido: «Una pintura al óleo detallada de un viejo capitán de barco, dirigiendo su barco a través de una tormenta. El agua salada salpica su rostro curtido y la determinación se refleja en sus ojos. Arriba se ven nubes malévolas girando y las olas de popa amenazan con sumergir el barco mientras las gaviotas se sumergen y giran en el paisaje caótico. Truenos y luces se embarcan en la distancia, iluminando la escena con un inquietante brillo verde».

El resultado de ese prompt, publicado por la compañía en su sitio oficial, fue el siguiente:

Una vez que el resultado está listo, el usuario podrá seguir dándole indicaciones al chatbot para mejorar esa imagen. «No tendrás que complicarte con indicaciones realmente largas», aseguró Aditya Ramesh, investigador principal y jefe del equipo de Dall-E, y añadió: «En lugar de eso, puedes simplemente interactuar con ChatGPT como si estuvieras hablando con un compañero de trabajo».

El esfuerzo de OpenAI por mejorar su generador de imágenes basado en IA se da en un contexto en el que sus competidores, entre los que se destacan alternativas como Midjourney y Stable Diffusion, han demostrado capacidades notables para entregar resultados de calidad.

DALL-E 3 ya está disponible a través de ChatGPT Plus, la versión de pago del chatbot.

Puja por los derechos de autor de las obras utilizadas

<br. < p=»»></br. <>

Dado que DALL-E fue entrenado con imágenes producidas por artistas de todo el mundo, desde su lanzamiento se inició una controversia a raíz de los reclamos de autores que no estaban de acuerdo con que sus obras fueran utilizadas por la empresa.

Es por esto que OpenAI también anunció que ofrecerá a los artistas la posibilidad de eliminar sus obras de futuros entrenamientos. Además, DALL-E 3 también evitará que los usuarios intenten generar una obra de arte con el estilo de un artista conocido, detectando cuándo se incluye en una pregunta.

OpenAI también cuenta con barreras para impedir que los usuarios generen obras de arte pornográficas, gráficamente violentas o imágenes en las que aparezcan personajes públicos.