Google acaba de anunciar su propio generador de imágenes a partir de texto, con una mejora de calidad importante con respecto a otros generadores del mercado.
Pues han desarrollado un sistema AI que ofrece un grado de fotorrealismo sin precedentes y un nivel profundo en cuanto a la comprensión del lenguaje.
Hasta el día de hoy, el líder de este mercado ha sido DALL-E 2, un programa desarrollado por OpenAI en el 2021 y que ha recibido su última actualización en abril de este año.
Sin embargo, Google ha llegado a desbancar a este gigante tecnológico y presenta «Imagen», su nueva AI capaz de generar imágenes a partir de una pequeña descripción.
Y aunque el funcionamiento de «Imagen» es muy similar al de DALL-E 2, existen algunas diferencias importantes que hacen que los resultados sean más precisos.DALL-E: la inteligencia artificial crea imágenes que no existen a partir de frases
Innovaciones del nuevo sistema AI de Google
El nuevo sistema AI de Google para generar imágenes ultrarrealistas a partir de texto ha mejorado significativamente la comprensión del lenguaje para ofrecer resultados más exactos.«Nuestro descubrimiento clave es que los modelos genéricos de lenguaje grande (p. ej. T5), preentrenados en cuerpos de solo texto, son sorprendentemente efectivos para codificar texto para la síntesis de imágenes: aumentar el tamaño del modelo de lenguaje en Imagen aumenta tanto la fidelidad de la muestra como la alineación imagen-texto mucho más que aumentar el tamaño del modelo de difusión de imágenes»
Incluso se utilizó un punto de referencia llamado «DrawBench» que …