En enero de 2021, OpenAI —una de las principales organizaciones de investigación en el campo de la inteligencia artificial, perteneciente a Google— presentó una interesante IA llamada DALL-E, capaz de generar imágenes de la nada, a partir de una descripción proporcionada por el usuario.
Para 'entender' lo que le queremos decir, DALL-E se basa en la tecnología de GPT-3, la revolucionaria IA de OpenAI dedicada al análisis y generación de textos. Lo mejor de todo es que se mostraba capaz no sólo de recrear imágenes ya existentes en la vida real, sino también 'hacerse a la idea' de cómo podría lucir algún concepto mucho más surrealista. Por ejemplo, 'DALL-E, quiero una taza de té con forma de aguacate' (ver imagen de arriba).
Sí, el nombre de 'DALL-E' homenajea tanto a nuestro Salvador Dalí como al robot WALL-E
Ahora, Google/OpenAI acaba de desvelar que ha desarrollado una nueva versión de esta IA, conocida como DALL—E 2. Tras más de un año revisando de cerca problemas potenciales como los sesgos en la generación de imágenes o la producción de información errónea, y mejorando en general el rendimiento del modelo y la calidad de las imágenes, la compañía se ha animado a añadir algunas funciones nuevas a esta inteligencia artificial.
Además, ha aplicado a este nuevo modelo la tecnología de otra IA presentada al mismo tiempo que el DALL-E original, CLIP, dedicado al análisis y categorización de imágenes. Y lo ha hecho invirtiendo su función: si CLIP era capaz de …