Stable Difussion es una de las más avanzadas tecnologías de Inteligencia Artificial a la hora de generar imágenes increíbles a través de una simple idea o frase. Es completamente gratuita y open-source.
Ahora, un nuevo software lanzado puede mejorar sus capacidades aún más. Se trata de ControlNet, una nueva estructura de red y que tiene el objetivo de "controlar los grandes modelos de difusión preentrenados para que admitan condiciones de entrada adicionales". Es decir, puede modificar la salida de Stable Diffusion para que se ajuste a más modelos y esto hace que Stable Difussion sea más versátil.
En Genbeta
El open source, un elemento clave en la explosión de inteligencia artificial que está ocurriendo ante nuestros ojos
Cómo funciona
Fue presentado por investigadores de Cornell University. Estos explican que los grandes modelos de difusión, como Stable Difussion, pueden ampliarse con redes de control para permitir entradas condicionales como mapas de bordes, mapas de segmentación, puntos clave, etc.
Lo que hace es ofrecer más modelos preentrenados para que el resultado pueda ser más ajustado a lo que quieres. Hay varios modelos disponibles. Por ejemplo, Canny Edge —que detecta bordes—, Open POSE o User Scribble. Esta última es una alternativa para que puedas dibujar un garabato y de ahí se crea una imagen basada en este. Un ejemplo de este último modelo mencionado lo tienes en esta foto:
…