Dall-E2 es un sistema diseñado para generar imágenes con Inteligencia Artificial (IA) a partir de descripciones escritas por los usuarios, con resultados de gran realismo.
Diseñada por OpenAI, compañía de investigación de inteligencia artificial sin fines de lucro que tiene como objetivo promover y desarrollar una IA amigable, es capaz de crear retratos fotorrealistas a partir de textos descriptivos.
La cuenta de TikTok Robot Overloards utiliza imágenes creadas con DALL-E2 para retratar el apocalipsis es furor dentro del ecosistema de las redes sociales y tiene más de 250 mil seguidores y 7.2 millones de "Me Gusta".
DALL-E2: así se puede solicitar acceso al popular generador de imágenes
A raíz de las repercusiones que cosecharon las fotos generadas con la IA de OpenAI, muchas personas están interesadas en utilizarla, pero no todos podrán hacerlo.
Esto se debe a que el programa está en fase beta, por lo que el acceso se encuentra limitado a cierta cantidad de usuarios.
Según explica OpenAI, la lista de espera para acceder a DALL-E 2 está a pleno, pero la compañía aumentará drásticamente el envío de invitaciones para que 1 millón de personas puedan probar el generador de imágenes, reveló el portal español xataka.
Retratos realizados con la IA
Para sumarse a la lista solamente se debe que completar un formulario en la página de OpenAI y aguardar.
Las invitaciones se enviarán "durante las próximas semanas" explicaron desde la compañía y los seleccionados tendrán 50 créditos gratis para utilizar el primer mes y 15 créditos adicionales el mes siguiente.
Según detallaron desde OpenAI, cada crédito se podrá utilizar para una generación de solicitud en DALL-E (que ofrece cuatro imágenes), una solicitud de edición o una variación (que ofrece tres imágenes).
También se podrán comprar créditos adicionales. Su valor es de u$s15 para obtener 115 créditos.
Cabe señalar que OpenAI mantiene una serie de restricciones en el sistema para evitar la creación de contenido engañoso.
Por ejemplo, no se pueden cargar imágenes de figuras públicas.
Retrato realizado con la IA
La respuesta de Google: Imagen
Google, con su proyecto Imagen, quiere competirle a Dall-E2, y obtener un sistema diseñado para generar imágenes a partir de descripciones escritas por los usuarios, con resultados de gran realismo.
Google presentó su proyecto de IA como un modelo de difusión de texto a imagen, el cual plantea una alternativa a la IA de OpenAI, Dall-E2. Imagen es capaz de crear imágenes fotorrealistas a partir de textos descriptivos.
Imagen creada a partir de "una pared en un castillo real. Hay dos cuadros en la pared. El de la izquierda es un óleo detallado del rey mapache real. El de la derecha es un óleo detallado de la reina mapache". La IA está construido a partir de grandes modelos lingüísticos para lograr un mejor entendimiento de la descripción, y crea una imagen que se adecúe con mayor eficiencia a las descripciones realizadas.
Uno de los principales descubrimientos que han realizado en el desarrollo de Imagen, es que la integración de amplios modelos de lenguaje aumenta la fidelidad y la alineación imagen-texto, mucho más que el aumentar el tamaño del modelo de difusión de imágenes. Así, los modelos de lenguaje genéricos de gran tamaño, los cuales están pre entrenados en la interpretación de corpus de textos (serie de fragmentos de lenguaje estructurados), son ideales para las funciones de este proyecto de IA. Además, permiten conseguir imágenes de alta calidad y relación con el texto como las que hemos visto.
Google también publicó un DrawBench. Su finalidad es servir de guía y comparativa, siendo un punto de referencia de la aceptación de Imagen, frente a los otros motores de IA para la creación de imágenes a partir de texto en el mercado, como Dall-E2 y VQ-GAN+CLIP.