Pocos días después de haber presentado al mundo las capacidades de Gemini, su nuevo gran modelo de lenguaje, Google ha hecho oficial una nueva versión de Imagen, su modelo text-to-image que permite generar fotografías a partir de descripciones de texto. Su nombre es Imagen 2, y la compañía ha prometido grandes avances en la precisión, el realismo y la versatilidad del modelo.Imagen 2 permite generar imágenes más realistas con textos legiblesEn el anuncio, la compañía afirma que Imagen 2 es su tecnología de generación de imágenes más avanzada hasta la fecha. Con respecto a la anterior versión de Imagen, esta es capaz de proporcionar fotografías más realistas y de mayor calidad, además de haber mejorado de manera notable la consistencia de los resultados a partir de los prompts del usuario.Imagen 2 llega con el punto de mira puesto en DALL-E 3, la última versión del modelo text-to-image de Open AI. La compañía del buscador asegura haber añadido descripciones adicionales a las imágenes usadas en el conjunto de datos que se utilizó para entrenar al modelo, de modo que este sea capaz de comprender diferentes estilos y ser más preciso a la hora de seguir las indicaciones del usuario.Durante el entrenamiento, Google también se centró en mejorar algunos de los puntos débiles de Imagen (y de otros modelos de este tipo), como el renderizado de imágenes, dientes, rostros humanos u otros rasgos con los que la IA suele tener problemas.Combinando texto e imágenes como entrada, Imagen 2 es capaz de generar …