OpenAI ha desvelado su más reciente herramienta de inteligencia artificial orientada a la creación artística: Dall-E 3.
Trabajo conjunto con ChatGPT
Este innovador software aprovecha la potencia de su exitoso chatbot, ChatGPT, para potenciar la elaboración de obras de arte más complejas y meticulosamente compuestas. Lo logra al ampliar de manera automática las instrucciones, conocidas como “prompts,” para proporcionar al generador directrices más detalladas y coherentes.
La principal ventaja de Dall-E 3 radica en su simplificación del proceso en comparación con versiones anteriores. Se elimina la complejidad asociada a la ingeniería de prompts, permitiendo a los usuarios realizar mejoras mediante la interfaz conversacional de ChatGPT.
Esta novedosa herramienta tiene el potencial de reducir la barrera de entrada para la generación de obras de arte de IA altamente sofisticadas y, al mismo tiempo, fortalece la posición de OpenAI en el mercado gracias a las destacadas capacidades de su chatbot.
Un importante avance en el campo de la IA generativa
Este logro representa un hito significativo no solo para Dall-E, sino para el ámbito del arte generativo en inteligencia artificial en su totalidad. Dall-E, un juego de palabras que fusiona el nombre del carismático personaje de Pixar, Wall-E, y el influyente artista Salvador Dalí, fue anunciado en 2021 y lanzado en 2022.
Este algoritmo se nutre de extensas bases de datos de imágenes debidamente etiquetadas, recopiladas de la web y diversas fuentes. Su funcionamiento se basa en lo que se conoce como un modelo de difusión, diseñado para anticipar la representación de una imagen conforme a una solicitud específica.
Gracias a la disponibilidad de vastos conjuntos de datos, Dall-E es capaz de generar imágenes de alta complejidad, coherencia y atractivo estético. La distinción fundamental de Dall-E 3 radica en la manera en que fomenta la interacción entre humanos y máquinas.
Refinando cada imagen creada
Dall-E 3 ofrece a los usuarios la posibilidad de perfeccionar sus creaciones a través de ChatGPT, de manera similar a cómo solicitarían ajustes a un artista real.
El investigador principal y líder del equipo de Dall-E, Aditya Ramesh, subraya que los usuarios no deben preocuparse por proporcionar indicaciones excesivamente detalladas. En su lugar, pueden interactuar con ChatGPT de manera sencilla, como si estuvieran manteniendo una conversación con un colega de trabajo.
Dall-E 3 disponible a través de ChatGPT Plus
En el transcurso de 2022, la irrupción de numerosos generadores de arte impulsados por inteligencia artificial marcó el inicio de un florecimiento más amplio en el ámbito de la IA generativa.
Los primeros generadores, en su mayoría rudimentarios y carentes de la capacidad para refinar o editar imágenes, dieron paso a una nueva ola de creatividad. Junto a OpenAI, startups como Midjourney, Stable Diffusion e Ideogram han atraído significativas inversiones y generado un gran interés público.
Sin embargo, el empleo de estos sistemas artísticos basados en IA ha generado inquietudes, tanto en lo que respecta a la posible competencia con artistas humanos profesionales como al modo en que las empresas de IA utilizan material protegido por derechos de autor para entrenar sus algoritmos.
OpenAI se compromete a salvaguardar a los artistas
Como respuesta a la controversia suscitada, OpenAI ha anunciado su intención de brindar a los artistas la posibilidad de excluir sus obras de los futuros procesos de entrenamiento.
Dall-E 3 también se asegura de evitar que los usuarios intenten generar obras de arte que imiten el estilo de artistas reconocidos, detectando cuando dicha intención se incorpora en una consulta.
OpenAI ha implementado salvaguardias adicionales para prevenir la generación de contenido pornográfico, violento o imágenes que incluyan figuras públicas.
Sandhini Agarwal, investigadora de políticas en OpenAI, señala que la nueva versión de Dall-E ha sido sometida a una evaluación de “grupo rojo” aún más rigurosa, en la que los investigadores intentan poner a prueba las defensas de protección.
“Cualquier solicitud explícita de contenido de naturaleza inapropiada será sometida a un análisis de clasificación y rechazada”, asegura Agarwal. Por supuesto, algunos programadores han desarrollado generadores de imágenes de código abierto sin restricciones de ningún tipo.